Salva e fai il backup di siti Web per la lettura offline con HTTrack

Salva e fai il backup di siti Web per la lettura offline con HTTrack

Sì, puoi scaricare siti Web per la navigazione offline e può salvarti la vita. Forse hai bisogno di mostrare un sito web a un cliente presso la loro sede o rivedere le risorse mentre vai al lavoro. Quando esegui il backup dei siti Web, puoi fare tutto questo e altro ancora.





Avere accesso a un backup completo del sito Web ti dà molta più libertà rispetto a limitarti a poche pagine selezionate. Mentre estensioni del browser per la lettura offline , come ScrapBook [Non più disponibile] per Firefox, può salvare singole pagine, HTTrack è un'applicazione autonoma che può scaricare interi siti Web, inclusi file multimediali e collegamenti esterni.





In questo articolo imparerai come configurare HTTrack per scaricare siti Web completi per la navigazione offline. Si noti che sebbene l'applicazione non sia stata aggiornata dal 2015, l'abbiamo testata sull'ultima versione di Windows 10 e non abbiamo riscontrato problemi.





Che cos'è HTTrack?

HTTrack può scaricare siti Web per la navigazione offline. È possibile copiare un'intera pagina Web da Internet in una directory locale, incluso il codice HTML completo, le immagini e altri file archiviati sul server. Dopo aver eseguito il mirroring di un sito Web sul tuo computer, puoi avviarlo nel browser e navigare tra le pagine, come se stessi guardando la versione originale. Puoi anche aggiornare le pagine scaricate per acquisire le informazioni aggiunte di recente.

Ecco alcune cose che HTTrack può fare:



  • download di un intero sito web
  • autenticarsi con username e password
  • mirroring di file e siti Web esterni
  • escludendo file specifici dal progetto, ad es. File ZIP o GIF
  • imaging o test dei segnalibri utilizzando il file bookmark.html

Gli utenti avanzati possono applicare comandi e filtri elaborati per scaricare esattamente ciò di cui hanno bisogno. Questa guida di Fred Cohen ti darà una panoramica dei comandi e di come usarli. Contiene anche uno strumento di risoluzione dei problemi, nel caso in cui i mirror del tuo sito Web non funzionino come previsto.

Si noti che HTTrack non supporta l'acquisizione di streaming audio/video in tempo reale. Allo stesso modo, lo script java e le applet java potrebbero non essere scaricati. Inoltre, il programma può bloccarsi se lo si tassa con un progetto complesso.





Configura HTTrack per scaricare la tua prima pagina

HTTrack è semplice da usare, anche se può diventare un po' complicato quando le impostazioni predefinite non funzionano.

Scarica: HTTrack per Windows, Linux , e Android





Nuovo progetto

Dalla pagina iniziale, fare clic su Avanti > per impostare il tuo primo progetto. Entrare in un Nome del progetto e imposta un Categoria se ti piace. Scegli anche un Percorso di base , che è la directory locale in cui HTTrack salverà il tuo progetto. Ai fini di questo articolo, sto eseguendo il backup del portale scientifico su Wikipedia. Clic Avanti > quando hai fatto.

Modalità di download

Per un progetto di mirroring di base, puoi semplicemente incollare l'URL o gli URL del siti web di cui desideri eseguire il backup nel Indirizzi web campo. Puoi anche aggiungere un elenco di URL utilizzando un file TXT. Se il sito web che vuoi copiare richiede l'autenticazione, seleziona Aggiungi URL... e - oltre al URL -- Inserisci la tua Login (nome utente o indirizzo email) e Parola d'ordine ; clic ok per confermare.

Non dimenticare di scegliere un Azione per il tuo progetto L'azione dipende dal tuo obiettivo. Per questo progetto, procederò con Scarica il/i sito/i web .

Ecco cosa faranno le diverse azioni:

  • Scarica il/i sito/i web scaricherà le pagine desiderate con le opzioni predefinite.
  • Scarica sito/i web + domande trasferirà i siti desiderati con le opzioni predefinite e farà domande se i collegamenti sono considerati potenzialmente scaricabili.
  • Ottieni file separati otterrà solo i file specificati all'interno delle opzioni, ma non eseguirà lo spider attraverso i file HTML.
  • Scarica tutti i siti in pagine (mirror multipli) scaricherà solo i siti collegati dai siti selezionati. Se trascini il file bookmark.html nel campo Indirizzi Web, questa opzione ti consente di rispecchiare tutti i tuoi segnalibri.
  • Link di prova nelle pagine (test segnalibro) testerà tutti i link indicati.
  • * Continua download interrotto completerà un download interrotto.
  • * Aggiorna il download esistente aggiornerà un progetto esistente. Il motore esaminerà la struttura completa, controllando ogni file scaricato per eventuali aggiornamenti sul sito web.

Preferenze e Opzioni Specchio

Diamo un'occhiata alle opzioni che hai per il tuo progetto. Clicca il Imposta opzioni... collegamento in basso a destra nella finestra.

Qui è dove diventa un po' più complicato. Come vedi, HTTrack supporta proxy impostazioni; Puoi Configura l'indirizzo, la porta e l'autenticazione. Entro Regole di scansione puoi usare i caratteri jolly per definire i file che il tuo progetto dovrebbe includere o escludere nel suo backup. limiti è probabilmente la scheda più importante perché qui puoi impostare una profondità per la profondità di mirroring interna ed esterna. Inoltre, puoi limitare la dimensione dei file HTML, il tempo, la velocità di trasferimento, il numero di connessioni al secondo e il numero di collegamenti.

Se stai riscontrando problemi, ad esempio progetti che vengono interrotti immediatamente, puoi provare a cambiare il tuo ID browser o gioca con le impostazioni nel Ragno scheda. Consulta il Domande frequenti e risoluzione dei problemi sezione sulla homepage di HTTrack se incontri ostacoli che non puoi superare da solo. Clic ok per confermare le modifiche. Quindi fare clic su Avanti > per passare alla fase finale della creazione del progetto.

Regolazioni finali

Quest'ultimo passaggio ti consente di regolare le impostazioni minori. Ad esempio, puoi lasciare che HTTrack Spegni il PC al termine , metti il ​​progetto In attesa per un determinato periodo di tempo, o Salva solo le impostazioni, non avviare il download ora.

E Azione!

Una volta colpito Fine , lo strumento inizierà immediatamente a salvare i file. Mentre HTTrack sta canticchiando, puoi monitorare i suoi progressi.

Per testare il tuo progetto, vai alla directory che hai selezionato, apri la cartella del progetto e fai clic su index.html file per avviare il sito Web con mirroring nel browser predefinito.

Se il tuo progetto non funziona, ricomincia e gioca con le opzioni. Potrebbero essere necessari alcuni tentativi ed errori. E anche se alcune impostazioni hanno funzionato perfettamente in un'esecuzione precedente, potrebbero non funzionare la volta successiva. Come accennato in precedenza, la soluzione migliore è modificare l'ID del browser o fare riferimento alla pagina ufficiale di FAQ e risoluzione dei problemi.

Puoi annullare una corsa in qualsiasi momento. Dopo aver premuto il pulsante una volta, il programma completerà tutti i processi in esecuzione. Se vuoi interrompere immediatamente il progetto, premi di nuovo il pulsante Annulla. Per riprendere un backup, riavvia il progetto e seleziona * Continua download interrotto dal menu al rispettivo passaggio di configurazione descritto in precedenza.

Pronto per la navigazione offline?

Non è una sensazione liberatoria poter portare il web - o almeno parti di esso - ovunque, indipendentemente dall'essere costantemente connessi? Forse questo è un po' troppo. In ogni caso, è un'ottima opzione. Cosa ne pensi?

come faccio a sapere se il mio telefono è sotto controllo?

Quali siti web devi avere sempre con te? In quale altro modo usi lo strumento? Hai provato a testare i tuoi segnalibri con HTTrack?

Immagine di credito: ValentinT tramite Shutterstock.com

Condividere Condividere Tweet E-mail 6 alternative udibili: le migliori app per audiolibri gratuite o economiche

Se non ti va di pagare per gli audiolibri, ecco alcune fantastiche app che ti consentono di ascoltarli gratuitamente e legalmente.

Leggi Avanti
Argomenti correlati
  • finestre
  • Backup dei dati
  • Strumenti per i Webmaster
  • Navigazione offline
  • Scarica Gestione
Circa l'autore Tina Sieber(831 articoli pubblicati)

Mentre completava un dottorato di ricerca, Tina ha iniziato a scrivere di tecnologia di consumo nel 2006 e non ha mai smesso. Ora anche editor e SEO, la trovi su Twitter o percorrendo un sentiero nelle vicinanze.

Altro da Tina Sieber

Iscriviti alla nostra Newsletter

Iscriviti alla nostra newsletter per consigli tecnici, recensioni, ebook gratuiti e offerte esclusive!

Clicca qui per iscriverti