WayBack Machine di Internet Archive: cos’è, a cosa serve, come funziona

Di Riccardo Esposito | Pubblicato il

La WayBack Machine è uno strumento di Archive.org per vedere e rintracciare vecchie versioni delle pagine web. Si tratta di una macchina del tempo che effettua degli screenshot in momenti differenti del sito web e archivia il tutto in una timeline.

WayBack Machine di Internet Archive

Questo tool è utile per recuperare pagine web vecchie e cancellate da Google, ma puoi usare questo strumento anche per fare delle analisi SEO importanti e spiare la concorrenza, i siti web che vogliono collaborare con te e che ti offrono backlink.

Allora, ecco cos’è e come usare la internet time machine più famosa del web anche per ottenere vantaggi concreti. Sia in chiave SEO che per la tua strategia web.

Cos’è la wayback machine, definizione

La web time machine (web.archive.org) è uno strumento per recuperare e leggere le vecchie pagine dei siti web cancellate o cambiate nel tempo. La WayBack Machine nasce nel 2001 per volere di Brewster Kahle e Bruce Gilliat di Archive.org.

Questo tool recupera la cache dal 1996. Il nome di questa libreria digitale deriva dalla macchina del tempo presente in un cartone animato: Rocky & Bullwinkle.

Da leggere: i migliori tool per fare SEO copywriting

A cosa serve questa archive machine

L’obiettivo di partenza è quello di fornire una versione di tutte le pagine web cancellate o modificate in modo da fornire una conoscenza completa di internet.

Tutorial della WayBack Machine su YouTube.

Con i software di scansione che eseguono screenshot periodici del web puoi vedere la vecchia versione di una pagina web. Questo consente a webmaster, giornalisti, SEO e blogger di recuperare informazioni preziose. Con The WayBack Machine:

  • Scopri vecchi testi cambiati.
  • Archivi pagine che vuoi tutelare.
  • Verifichi cosa pubblicava un sito web.
  • Controlli domini da acquistare o linkare.
  • Puoi evitare link a pagine inesistenti.
  • Fai un lavoro di fact checking.
  • Controlli una fonte modificata.

Il WayBack Archive permette di recuperare URL eliminati e recuperare vecchie pagine web. Lo puoi fare anche per ritrovare testi del tuo portale che pensavi di aver perso o magari per mostrare ai tuoi lettori com’era il blog prima del restyling.

Questo è utile soprattutto per chi vuole acquistare un dominio e scoprire se in passato è stato usato per ospitare siti web di dubbia autorevolezza. Il web journalism usa spesso questo tool per capire se una fonte è stata cambiata.

WayBack Machine, come funziona

La internet machine funziona grazie ai crawler, programmi che scansionano il web e registrano screenshot delle pagine web nel tempo. Ecco un esempio, puoi cliccare sulla timeline o sui dot del calendario per visualizzare le vecchie versioni del sito.

La sezione calendar della macchina del tempo su internet.
La sezione calendar della macchina del tempo su internet.

Il funzionamento della Web Back Machine si divide in cicli che impiegano diverso tempo per memorizzare le pagine del web. Alcuni siti potrebbero non essere inclusi perché i crawler automatizzati non li hanno trovati al momento della scansione.

Le risorse web di archiviazione?

Nel tempo sono cresciute a dismisura e abbiamo una internet WayBack sempre più performante. Ecco qualche informazione per capire dimensioni e possibilità del tool.

Posso Wayback Machine per YouTube?

In questo caso c’è un trucco da utilizzare che ho scoperto su Reddit. Se vuoi scaricare vecchi video di YouTube recuperati con WayBack Machine devi andare su https://web.archive.org/web/20130720113437oe_/http://wayback-fakeurl.archive.org/yt/ e aggiungere subito dopo l’ID del video recuperato.

La WayBack Machine funziona su Instagram?

Purtroppo è noto il contrasto tra questo strumento per il monitoring delle vecchie pagine web e il social network in questione. Non è possibile risalire a vecchie versioni dei profili grazie a WayBack Machine che funziona solo su pagine di siti web.

Come scaricare un sito web da WayBack Machine

Con uno strumento specifico è possibile fare il download di un intero sito web archiviato su questo portale: www.waybackmachinedownloader.com.

Come usare la WayBack Machine

Come si usa The WayBack Machine? Basta andare nella home page del servizio e inserire l’URL che vuoi analizzare. Pochi secondi e arriva il risultato: una timeline con i vari screenshot del sito web eseguiti nel corso degli anni. Con quale criterio?

Quello della notorietà: più un portale è autorevole, maggiori sono i passaggi del crawler. Basta questo per concludere il tour nell’internet machine per andare indietro nel tempo? No, ci sono diverse funzioni che ti consentono di usare la internet WayBack Machine come un vero professionista del web marketing e della SEO.

Scopri come e quando un sito è cambiato

Dopo aver analizzato un permalink puoi cliccare su Changes e scoprire un calendario dei cambiamenti effettuati. Puoi utilizzare questo tool di WayBack Archive per identificare e visualizzare le modifiche nel contenuto degli archivi di URL.

Scopri come e quando un sito è cambiato
I vari screenshot del sito web.

Il colore dei box è indice del livello di cambiamento registrato durante la scansione. Se è grigio vuol dire che al passaggio del crawler il sito era simile alla versione precedente, giallo c’è un cambiamento e blu invece indica una modifica importante.

Estrapola tutti gli URL registrati da WayBack Machine

Vuoi scoprire tutti gli URL che il tool in questione ha registrato nel corso degli anni? Dopo aver analizzato un dominio puoi andare nella sezione omonima dedicata agli indirizzi dove trovi una tabella con tutti gli slug e le informazioni utili.

Puoi ottenere questo risultato anche digitando un operatore di ricerca specifico su Google: http://web.archive.org/*/www.esempio.com/*. In questo modo ottieni lo stesso risultato: una lista di pagine con data di screenshot e tipo di documento. Questo ti permette di estrapolare informazioni utili rispetto alle pagine pubblicate.

Confronta due versioni temporali della pagina web

Sempre nella versione Changes c’è un tool fondamentale. Se selezioni due box puoi comparare le versioni in modo da scoprire quali sono i punti di divergenza.

Confronta due versioni temporali della pagina web
In giallo i contenuti aggiunti, in blu quelli cancellati.

Ecco un esempio chiaro. Questo strumento è molto utile per scoprire le differenze tra versioni diverse dello stesso sito web, per effettuare analisi della concorrenza.

Fare screenshot di una pagina web e archiviarla

Una delle funzioni più interessanti per usare la WayBack Machine in modo virtuoso: puoi chiedere all’archivio di effettuare una scansione forzata con relativo screenshot della pagina. In questo modo puoi creare un’istantanea della pagina internet.

Registra una pagina web con scansione forzata.
Registra una pagina web con scansione forzata.

Puoi trovarla quando serve in archivio e tutelarla da eventuali copie del contenuto. Per ottenere questo basta andare in home page e inserire l’URL nella sezione dedicata: Save Page Now. Puoi fare tutto ciò anche installando l’add-on Chrome.

Individua tutti cambiamenti avvenuti sul sito web

Vuoi scoprire come e quando un sito web ha effettuato dei cambiamenti nella struttura e nel contenuto? Puoi utilizzare la funzione sitemap che, oltre a essere visivamente molto interessante, raggruppa tutti gli archivi del sito web organizzati per anni.

Individua tutti cambiamenti avvenuti su un sito con wayback machine.
La mappa dei cambiamenti sul sito web.

Il cerchio centrale è la radice (root) del sito web e gli anelli successivi che si spostano dal centro sono le pagine. Mentre scorri puoi fare clic su una qualsiasi delle singole pagine per andare direttamente a un archivio di quell’URL e analizzare il risultato.

Come cancellare un sito da WayBack Machine

Non a tutti fa piacere essere su questa directory storica delle risorse web. Come posso escludere o rimuovere le pagine del mio sito dalla Wayback Machine? Puoi inviare un’e-mail di richiesta per la revisione a info@archive.org con l’URL.

Ricorda, in ogni caso, che la WayBack Machine non può entrare nelle risorse che non permettono l’indicizzazione. Quindi sono automaticamente escluse tutte le pagine bloccate da noindex su robots.txt, meta tag robots e accesso tramite password.

Siti web simili, tool e alternative utili

Conosciamo altre web machine per tornare indietro nel tempo e recuperare vecchie pagine su internet? Ci sarebbe la cache di Google che ti consente di vedere com’era una pagina web dopo l’ultimo passaggio del crawler, ma al massimo torni indietro di qualche settimana. Nulla di paragonabile alla Web Back Machine, è chiaro.

Ci sono alcune alternative da valutare come ad esempio Stillio che cattura screenshot di uno o più siti web in automatico nel tempo. Qualcosa del genere fa archive.ph e www.pagefreezer.com perché puoi aggiungere un URL o un permalink e registrare le varie versioni nel tempo. Queste alternative alla WayBack Machine di Internet Archive, però, in primo luogo sono strumenti proprietari, con versioni a pagamento.

Inoltre funzionano sempre su tuo comando, dopo che tu hai deciso di monitorare e spiare i siti web che ti interessano. Non lavorano in automatico e non sull’interno WWW. Quindi al momento non c’è nulla di paragonabile alla WayBack Machine.

Da leggere: come scoprire temi e plugin WordPress

Internet WayBack: come lo stai usando?

Io uso questo tool ogni giorno per divertimento, per scoprire qualcosa in più sui competitor e per verificare le fonti. Anche per capire come sono cambiati i migliori temi WordPress nel tempo e per scoprire qualche dettaglio in più. Anche tu usi WayBack Machine in questo modo? Raccontami la tua esperienza.

Riccardo Esposito

Sono un web writer freelance. Mi occupo di scrittura online dal 2009, mi sono specializzato nella stesura di piani editoriali per blog aziendali. Ho scritto 3 libri dedicati al mondo del blogging e della scrittura online (bio di Riccardo Esposito).

Categoria: Strumenti per blog

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Torna in alto