Facebook 網路爬蟲會透過複製和貼上連結,或藉由 Facebook 社群外掛程式,爬取 Facebook 上所分享應用程式或網站的 HTML。網路爬蟲會收集、快取和顯示有關應用程式或網站的資訊,例如標題、說明及縮圖影像。
Range
標頭中指定的位元組,產生並傳回包含所有必要屬性的回應,或者應該完全略過 Range
標頭。Facebook 網路爬蟲用戶代理程式字串:
facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)
facebookexternalhit/1.1
facebookcatalog/1.0
若要取得網路爬蟲目前使用的 IP 位址清單,請執行以下指令。
whois -h whois.radb.net -- '-i origin AS32934' | grep ^route
這些 IP 位址經常變更。
... route: 69.63.176.0/21 route: 69.63.184.0/21 route: 66.220.144.0/20 route: 69.63.176.0/20 route6: 2620:0:1c00::/40 route6: 2a03:2880::/32 route6: 2a03:2880:fffe::/48 route6: 2a03:2880:ffff::/48 route6: 2620:0:1cff::/48 ...