Il crawler di Facebook esegue la scansione dell'HTML di un'app o di un sito web condiviso su Facebook copiando e incollando il link o tramite un plug-in social di Facebook. Il crawler raccoglie, memorizza nella cache e visualizza le informazioni sull'app o sul sito web come il titolo, la descrizione e l'immagine in miniatura.
Range
della richiesta del crawler o dovrebbe ignorare del tutto l'intestazione Range
.Le stringhe agente utente del crawler di Facebook:
facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)
facebookexternalhit/1.1
facebookcatalog/1.0
Esegui il seguente comando per ottenere una lista aggiornata degli indirizzi IP usati dal crawler.
whois -h whois.radb.net -- '-i origin AS32934' | grep ^route
Questi indirizzi IP cambiano spesso.
... route: 69.63.176.0/21 route: 69.63.184.0/21 route: 66.220.144.0/20 route: 69.63.176.0/20 route6: 2620:0:1c00::/40 route6: 2a03:2880::/32 route6: 2a03:2880:fffe::/48 route6: 2a03:2880:ffff::/48 route6: 2620:0:1cff::/48 ...
Se il contenuto della tua app o del tuo sito web non è disponibile al momento della scansione, puoi forzare una scansione quando sarà disponibile passando l'URL attraverso lo strumento Debugger di condivisione o utilizzando l'API Sharing.
Puoi simulare una richiesta del crawler con il seguente codice:
curl -v --compressed -H "Range: bytes=0-524288" -H "Connection: close" -A "facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)" "$URL"