GNU/Linux >> Tutoriales Linux >  >> Linux

¿Cómo obtener el contenido de una página web en una variable de shell?

Puedes usar wget comando para descargar la página y leerla en una variable como:

content=$(wget google.com -q -O -)
echo $content

Usamos el -O opción de wget lo que nos permite especificar el nombre del archivo en el que wget vuelca el contenido de la página. Especificamos - para obtener el volcado en la salida estándar y recopilarlo en la variable content . Puedes agregar el -q Opción silenciosa para apagar la salida wget.

Puede usar el comando curl para esto también:

content=$(curl -L google.com)
echo $content

Necesitamos usar el -L ya que la página que estamos solicitando podría haberse movido. En cuyo caso necesitamos obtener la página desde la nueva ubicación. El -L o --location nos ayuda con esto.


Hay muchas formas de obtener una página desde la línea de comandos... pero también depende de si quieres el código fuente o la página misma:

Si necesita el código fuente:

con rizo:

curl $url

con wget:

wget -O - $url

pero si quieres obtener lo que puedes ver con un navegador, lynx puede serte útil:

lynx -dump $url

Creo que puede encontrar muchas soluciones para este pequeño problema, tal vez debería leer todas las páginas man para esos comandos. Y no olvides reemplazar $url por su URL :)

Buena suerte :)


Linux
  1. Conceptos básicos de Linux:cómo descargar archivos en el Shell con Wget

  2. ¿Cómo asignar la salida de un comando a una variable de shell?

  3. ¿Cómo obtener la dirección IP propia y guardarla en una variable en un script de Shell?

  4. Cómo cambiar el shell predeterminado en Linux

  5. ¿Cómo obtener mediante programación el tamaño de la página de caché de la CPU en C++?

Cómo obtener el tamaño de un directorio en Linux

¿Cómo obtener la suma Md5 del contenido de un directorio como una sola suma?

¿Cómo usar el comando wget en Linux?

¿Cómo obtener el nombre de la rama git actual en una variable en un script de Shell?

¿Cómo almacenar el resultado de un comando de shell ejecutado en una variable en python?

¿Cómo obtener el PYTHONPATH en shell?