GNU/Linux >> Tutoriales Linux > >> Linux

¿Cómo extraigo todos los enlaces externos de una página web y los guardo en un archivo?

Necesitarás 2 herramientas, lynx y awk , prueba esto:

$ lynx -dump http://www.google.com.br | awk '/http/{print $2}' > links.txt

Si necesita líneas de numeración, use el comando nl , prueba esto:

$ lynx -dump http://www.google.com.br | awk '/http/{print $2}' | nl > links.txt

Aquí hay una mejora en la respuesta de lelton:no necesitas awk en absoluto porque lynx tiene algunas opciones útiles.

lynx -listonly -nonumbers -dump http://www.google.com.br

si quieres numeros

lynx -listonly -dump http://www.google.com.br

Linux

Comprender las rutas de los archivos y cómo usarlas en Linux

Cómo obtener la fecha y hora actuales en Python

Cómo usar Sudo y el archivo Sudoers

Cómo guardar un archivo en Vim/Vi y salir del editor

Cómo guardar un archivo en Vi / Vim y salir del editor

Cómo grabar audio y guardar como archivo MP3 usando Audacity