America Linux: Descargar página web completa
Mostrando entradas con la etiqueta Descargar página web completa. Mostrar todas las entradas
Mostrando entradas con la etiqueta Descargar página web completa. Mostrar todas las entradas

jueves, 13 de agosto de 2009

Descargar un sitio completo con el comando wget

Si queremos descargar el contenido de un sitio online completo (incluyendo todas las imagenes y ficheros del mismo) y poder consultar o navegar por la informacion una vez que estemos desconectados, podemos ejecutar el siguiente comando:

wget -r -p http://www.ejemplo.com


Sustituyendo http://www.ejemplo.com por la URL del sitio en cuestion. Podemos ampliar este comando de la siguiente forma:

wget --random-wait -r -p -U mozilla http://www.ejemplo.com


–random-wait, hace que la descarga de contenido sea aleatoria, pues muchos sitios cuando observan descargas multiples y masivas de ficheros, limitan la descarga o la cortan.

-U mozilla, permite engañar al sitio online haciendoles creer que somos un navegador convencional, en muchos otros casos estos sitios al no detectar un browser valido impiden la descarga.

Podeis ampliar toda esta informacion consultando en Manpage de wget