Pengikisan Web menggunakan cURL di PHP

Kita semua telah mencoba mendapatkan data dari situs web dengan banyak cara. Pada artikel ini, kita akan mempelajari cara mengikis web menggunakan bot untuk mengekstrak konten dan data dari sebuah situs web.

Kami akan menggunakan PHP cURL untuk mengikis halaman web, sepertinya salah ketik meninggalkan caps lock, tapi begitulah cara Anda menulisnya. cURL adalah sistem yang digunakan untuk membuat permintaan HTTP dengan PHP. Ini adalah cara memanggil halaman web dari dalam skrip Anda.

NSMengikis Data, Bukan Kontenpernyataan ini untuk semua orang yang ingin belajar web scraping. cURL dan web scraping adalah alat yang ampuh yang dapat digunakan untuk mengotomatisasi apa yang seharusnya menjadi tugas berulang yang agak lama dan membosankan. Kita hanya boleh mengikis informasi, bukan artikel dan konten lengkap.

Contoh: Contoh berikut menunjukkan pengikisan gambar dari artikel https://www.geeksforgeeks.org/matlab-data-types/

PHP

<?php

 

$ch = curl_init();

 

curl_setopt($ch, CURLOPT_URL,

 

curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);

 

$output = curl_exec($ch);

 

curl_close($ch);

 

echo '<head>';

echo '<meta http-equiv="content-type"

    content="text/html; charset=utf-8" />';

echo '</head>';

echo '<body>';

 

echo '<h1>Web Scraping using cURL</h1>';

 

preg_match_all(

    $output, $data

);

 

foreach ($data[0] as $list) {

    echo "<img src="https://www.geeksforgeeks.org/web-scrapping-using-curl-in-php/$list"/>";

}

 

echo '</body>';

 

?>

Keluaran:

goresan web