Wget es un administrador de descargas de código abierto. Es una aplicación de consola desarrollada principalmente para Linux, pero portada con éxito a otros sistemas operativos, incluidos Windows y MacOS.
123 hp con
Si no estás familiarizado con wget, definitivamente deberías probarlo. Es muy poderoso. Permite recuperar archivos de sitios web utilizando HTTP, HTTPS y FTP, los protocolos de Internet que utilizamos actualmente. Su comportamiento está controlado por argumentos de la línea de comando.
Wget admite una variedad de opciones para recuperar archivos en conexiones lentas o inestables, incluidos reintentos, continuar donde lo dejó y más. Admite el archivo 'robots.txt', por lo que puede funcionar como un rastreador web. Solo puede recuperar archivos modificados, admite comodines, límites de tipo de archivo y extensiones regulares.
Wget admite la recuperación recursiva de sitios web HTML y servidores FTP, lo que le permite crear un espejo del sitio web. Así es como se puede hacer.
Antes de continuar, debes obtener la aplicación wget.
Contenido esconder Obtenga Wget en Windows Obtenga Wget en Linux Debian/Ubuntu/Mint: CentOS/Redhat Arco Linux Linux vacío Para hacer una copia sin conexión de un sitio con Wget,Obtenga Wget en Windows
Normalmente uso binarios de estas fuentes:
Ambos hacen su trabajo.
Obtenga Wget en Linux
Utilice el administrador de paquetes de su distribución. Algunos ejemplos (ejecútelos como root):
Debian/Ubuntu/Mint:
|_+_|
CentOS/Redhat
|_+_|
Arco Linux
|_+_|
Linux vacío
|_+_|
Para hacer una copia sin conexión de un sitio con Wget,
- Abra el símbolo del sistema/terminal.
- En Windows, escriba la ruta completa al archivo wget.exe.
- En Linux, escriba simplemente wget.
- Ahora, escriba los siguientes argumentos para obtener el siguiente comando: |_+_|
- Reemplace el |_+_| parte con la URL del sitio real del que desea crear un espejo.
¡Estás listo!
Estos son los interruptores que utilizamos:
- |_+_| - aplica una serie de opciones para que la descarga sea recursiva.
- |_+_| – No rastree el directorio principal para obtener solo una parte del sitio.
- |_+_| - hace que todos los enlaces funcionen correctamente con la copia sin conexión.
- |_+_| - descargue archivos JS y CSS para conservar el estilo de página original al navegar por un espejo local.
- |_+_| - agrega las extensiones apropiadas (por ejemplo, html, css, js) a los archivos si se recuperaron sin ellas.
Eso es todo.