America Linux: Descargar un sitio completo con el comando wget

jueves, 13 de agosto de 2009

Descargar un sitio completo con el comando wget

Si queremos descargar el contenido de un sitio online completo (incluyendo todas las imagenes y ficheros del mismo) y poder consultar o navegar por la informacion una vez que estemos desconectados, podemos ejecutar el siguiente comando:

wget -r -p http://www.ejemplo.com


Sustituyendo http://www.ejemplo.com por la URL del sitio en cuestion. Podemos ampliar este comando de la siguiente forma:

wget --random-wait -r -p -U mozilla http://www.ejemplo.com


–random-wait, hace que la descarga de contenido sea aleatoria, pues muchos sitios cuando observan descargas multiples y masivas de ficheros, limitan la descarga o la cortan.

-U mozilla, permite engañar al sitio online haciendoles creer que somos un navegador convencional, en muchos otros casos estos sitios al no detectar un browser valido impiden la descarga.

Podeis ampliar toda esta informacion consultando en Manpage de wget

No hay comentarios:

Publicar un comentario