Facebook 网络爬虫将通过复制粘贴链接,或通过 Facebook 社交插件,爬取 Facebook 上分享的应用或网站的 HTML 数据。网络爬虫会收集、缓存和显示应用或网站相关信息,如网站标题、描述和缩略图等。
Range
标头中的指定字节,生成并返回带有所有必要属性的响应,或应一并忽略 Range
标头。Facebook 网络爬虫用户代理字符串:
facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)
facebookexternalhit/1.1
facebookcatalog/1.0
如要获取网络爬虫当前使用的 IP 地址列表,请运行以下命令。
whois -h whois.radb.net -- '-i origin AS32934' | grep ^route
这些 IP 地址经常发生更改。
... route: 69.63.176.0/21 route: 69.63.184.0/21 route: 66.220.144.0/20 route: 69.63.176.0/20 route6: 2620:0:1c00::/40 route6: 2a03:2880::/32 route6: 2a03:2880:fffe::/48 route6: 2a03:2880:ffff::/48 route6: 2620:0:1cff::/48 ...