Crawler Facebook merayapi HTML aplikasi atau situs web yang dibagikan di Facebook dengan menyalin dan menempelkan tautan atau menggunakan plugin sosial Facebook. Crawler mengumpulkan, menyimpan ke cache, dan menampilkan informasi tentang situs web atau aplikasi tersebut seperti judul, deskripsi, dan gambar mininya.
Range
dalam permintaan crawler atau harus sepenuhnya mengabaikan header Range
.String agen pengguna crawler Facebook:
facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)
facebookexternalhit/1.1
facebookcatalog/1.0
Untuk mendapatkan daftar alamat IP yang digunakan crawler saat ini, jalankan perintah berikut.
whois -h whois.radb.net -- '-i origin AS32934' | grep ^route
Alamat IP ini sering berubah.
... route: 69.63.176.0/21 route: 69.63.184.0/21 route: 66.220.144.0/20 route: 69.63.176.0/20 route6: 2620:0:1c00::/40 route6: 2a03:2880::/32 route6: 2a03:2880:fffe::/48 route6: 2a03:2880:ffff::/48 route6: 2620:0:1cff::/48 ...
Jika aplikasi atau konten situs web tidak tersedia saat proses perayapan, Anda dapat memaksa perayapan setelah konten tersedia dengan melewati URL melalui fitur Sharing Debugger atau menggunakan API Berbagi.
Anda dapat menyimulasikan permintaan crawler dengan kode berikut:
curl -v --compressed -H "Range: bytes=0-524288" -H "Connection: close" -A "facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)" "$URL"