Esta guía le mostrará cómo usar el wget
Comando a través de 10 ejemplos de uso común.
Wget es una utilidad de línea de comandos para descargar archivos de la web, creada por el Proyecto GNU. El nombre es una combinación de "World Wide Web" y "get".
Wget le permite descargar archivos utilizando los protocolos HTTP, HTTPS y FTP. Además, le brinda la capacidad de descargar varios archivos, reanudar descargas, limitar el ancho de banda, realizar descargas recursivas, descargar en segundo plano, duplicar un sitio web y aún más.
Al final de esta guía, sabrá todo lo que hay que saber sobre el wget
comando y cómo usarlo para descargar archivos de Internet.
Índice
- Instalación de Wget
- Instalación de Wget en Ubuntu, Debian y otras distribuciones basadas en Debian
- Instalación de Wget en Fedora, RHEL y otras distribuciones basadas en RHEL
- Instalación de Wget en Manjaro, Arch Linux y otras distribuciones basadas en Arch Linux
- Sintaxis del comando Wget
- 1. Descargar un archivo usando Wget
- 2. Uso del comando Wget para cambiar el nombre del archivo descargado
- 3. Descargar varios archivos con Wget
- 4. Reanudar una descarga usando Wget
- 5. Descargar archivos en segundo plano usando Wget
- 6. Limite la velocidad de descarga usando Wget
- 7. Descargar un archivo a un directorio específico
- 8. Descargue archivos protegidos con contraseña a través de HTTP o FTP usando Wget
- 9. Omitir verificación de certificado
- 10. Descargar contenido de un sitio web mediante Wget
- Conclusión
Instalando Wget
El paquete wget viene preinstalado en la mayoría de las distribuciones de Linux. Sin embargo, si wget
El comando no está instalado en su sistema, puede instalarlo fácilmente usando el administrador de paquetes.
Instalación de Wget en Ubuntu, Debian y otras distribuciones basadas en Debian
sudo apt install wget
Instalación de Wget en Fedora, RHEL y otras distribuciones basadas en RHEL
sudo dnf install wget
Instalación de Wget en Manjaro, Arch Linux y otras distribuciones basadas en Arch Linux
sudo pacman -S wget
Podrás usar el wget
comando una vez que se complete la configuración. Pero, primero, te mostraré los diez wget
más utilizados ejemplos de comandos que puede usar en su trabajo diario para comenzar.
Sintaxis del comando Wget
El wget
las expresiones de comando toman la siguiente sintaxis:
wget [OPTIONS] [URL]
[OPTIONS]
dice qué hacer con el[URL]
argumento provisto después.[URL]
es el archivo o el directorio que desea descargar.
1. Descargar un archivo usando Wget
La forma más sencilla de usar wget
es proporcionarle la ubicación de un archivo para descargar. Luego, cuando no se especifican opciones, wget
descarga el recurso especificado en el [URL]
al directorio actual.
Por ejemplo, puede obtener el archivo de imagen ISO de instalación de Arch Linux haciendo lo siguiente:
wget http://mirrors.mit.edu/archlinux/iso/2022.04.05/archlinux-2022.04.05-x86_64.iso
Como resultado, un archivo llamado archlinux-2022.04.05-x86_64.iso
descargas en el directorio de trabajo actual. Además, también verá información como el progreso de la descarga, la velocidad, el tamaño, la hora y la fecha.
2. Uso del comando Wget para cambiar el nombre del archivo descargado
Pase el -O
opción seguida del nombre preferido para guardar el archivo descargado con un nombre diferente.
Por ejemplo, el siguiente comando guardará el archivo de imagen ISO de instalación de Arch Linux como arch-install.iso
en lugar de su nombre original.
wget -O arch-install.iso http://mirrors.mit.edu/archlinux/iso/2022.04.05/archlinux-2022.04.05-x86_64.iso
3. Descargar varios archivos con Wget
Si desea utilizar wget
para descargar varios archivos a la vez, use -i
seguida de la ruta al archivo que contiene una lista de las URL que se descargarán. Además, cada URL debe colocarse en su línea.
En este ejemplo, recuperaremos las imágenes de instalación ISO de Arch Linux y Debian usando wget
. Sin embargo, primero necesitaremos crear un documento de texto e insertar las URL de descarga para hacerlo.
Entonces, primero, creemos un archivo con un nombre de nuestra elección, por ejemplo, urls.txt
, y poner en él las direcciones URL necesarias para los archivos que queremos descargar.
vim urls.txt
A continuación, debe usar -i
opción seguida del nombre del archivo para descargar todos los archivos almacenados en nuestro archivo de texto.
wget -i urls.txt
Eso es todo. Solo espera a que termine el proceso.
4. Reanudar una descarga usando Wget
Si pierde su conexión a Internet, su descarga puede ser interrumpida. De hecho, esto es algo bastante común cuando se descargan archivos de gran tamaño.
Entonces, en lugar de reiniciar la descarga desde cero, use -c
opción para continuar:
wget -c http://mirrors.mit.edu/archlinux/iso/2022.04.05/archlinux-2022.04.05-x86_64.iso
Sin embargo, si el servidor remoto no admite descargas reanudadas, wget
reiniciará la descarga y sobrescribirá el archivo existente.
5. Descargar archivos en segundo plano usando Wget
Agregando el -b
opción para wget
enviará la descarga en segundo plano inmediatamente después del inicio de la descarga. Si no se especifica ningún archivo de salida a través de -o
opción, la salida se redirige a wget-log
archivo.
wget -b http://mirrors.mit.edu/archlinux/iso/2022.04.05/archlinux-2022.04.05-x86_64.iso
Además, puede ver las acciones realizadas en segundo plano por wget
simplemente viendo el contenido del wget-log
expediente. Por ejemplo, las primeras diez líneas de su contenido se muestran en la imagen de arriba.
6. Limite la velocidad de descarga usando Wget
Al descargar un archivo grande a través de una conexión a Internet lenta, a veces es necesario limitar la velocidad de descarga del wget
comando para evitar que use todo su ancho de banda.
El siguiente ejemplo descargará la imagen ISO de instalación de Arch Linux y limitará la velocidad de descarga a 1 MB:
wget --limit-rate=1m http://mirrors.mit.edu/archlinux/iso/2022.04.05/archlinux-2022.04.05-x86_64.iso
7. Descargar un archivo a un directorio específico
Por defecto, wget
descarga archivos en el directorio de trabajo actual. Pero, por supuesto, wget
puede guardar los archivos descargados en un directorio predefinido.
El -P
La opción se utiliza para establecer el prefijo del directorio en el que se guardarán todos los archivos recuperados.
wget -P /tmp/ http://mirrors.mit.edu/archlinux/iso/2022.04.05/archlinux-2022.04.05-x86_64.iso
El comando anterior descargará el archivo ISO bajo /tmp
directorio.
8. Descargue archivos protegidos con contraseña a través de HTTP o FTP usando Wget
Si el sitio web que desea descargar está protegido con contraseña, el estándar wget
los comandos fallarán y mostrarán un error de acceso denegado al intentar descargar.
Sin embargo, podríamos usar la siguiente opción para incluir el nombre de usuario y la contraseña del sitio web protegido con contraseña junto con wget
comandos utilizados para recuperar el archivo.
Por ejemplo, para descargar un archivo de un servidor HTTP protegido con contraseña, deberá especificar el nombre de usuario y la contraseña como en este wget
ejemplo:
wget --http-user=username --http-password=password https://www.example.com/filename.tar.gz
Alternativamente, para descargar un archivo desde un servidor FTP protegido por contraseña, el wget
el comando es:
wget --ftp-user=username --ftp-password=password ftp://ftp.example.com/filename.tar.gz
9. Omitir verificación de certificado
Si desea utilizar wget
para descargar un archivo de un servidor con un certificado SSL no válido, por ejemplo, caducado o no de un emisor de confianza, puede utilizar --no-check-certificate
opción para forzar wget
para ignorar tales errores.
wget --no-check-certificate https://18.7.29.125/archlinux/iso/2022.04.05/archlinux-2022.04.05-x86_64.iso
10. Descargar contenido de un sitio web mediante Wget
El wget
El comando también se puede usar para descargar todo el contenido de un sitio web. Entonces puedes usar el -m
opción para crear un espejo del sitio web.
Esto hará una copia local completa del sitio web siguiendo y descargando todos los enlaces internos y recursos del sitio web.
wget -m -k -p -P /tmp/web/ https://www.example.com
-m | Hace que su descarga sea recursiva. |
-k | Todos los enlaces se convertirán para un uso adecuado sin conexión. |
-p | Esto incluirá todos los archivos necesarios, como imágenes, CSS, JS, etc. |
-P | Asegura que todo el contenido vaya a nuestro /tmp/web/ especificado directorio. |