GNU/Linux >> Tutoriales Linux >  >> Linux

¿Cómo puedo convertir fácilmente entidades especiales HTML de un flujo de entrada estándar en Linux?

Solución 1:

Perl es (como siempre) tu amigo. Creo que esto funcionará:

perl -n -mHTML::Entities -e ' ; print HTML::Entities::decode_entities($_) ;'

Por ejemplo:

echo '"test" & test $test ! test @ # $ % ^ & *' |perl -n -mHTML::Entities -e ' ; print HTML::Entities::decode_entities($_) ;'

Con salida:

[email protected] ~]$ echo '"test" & test $test ! test @ # $ % ^ & *' |perl -n -mHTML::Entities -e ' ; print HTML::Entities::decode_entities($_) ;'
"test" & test $test ! test @ # $ % ^ & *

Solución 2:

PHP se adapta bien a esto. Este ejemplo requiere PHP 5:

cat file.html | php -R 'echo html_entity_decode($argn);'

Solución 3:

recode parece estar disponible en los repositorios de paquetes predeterminados de las principales distribuciones de GNU/Linux. P.ej. para decodificar entidades HTML en UTF-8:

…|recode html..utf8

Solución 4:

Con Python 3:

python3 -c 'import html,sys; print(html.unescape(sys.stdin.read()), end="")' < file.html

Linux
  1. Cómo convertir de CentOS Linux 8 a CentOS Stream 8

  2. Linux:¿cómo ejecutar un gestor de arranque desde Linux?

  3. ¿Cómo puedo convertir espacios en pestañas en Vim o Linux?

  4. ¿Cómo puedo copiar una carpeta desde la línea de comandos de Linux?

  5. ¿Cómo puedo reservar un bloque de memoria del kernel de Linux?

Cómo ejecutar comandos desde la entrada estándar usando Tee y Xargs en Linux

Cómo convertir fácilmente tus videos en Linux

Cómo convertir CentOS Linux 8 a CentOS Stream [2 pasos]

Cómo migrar a CentOS Stream 8 desde CentOS Linux 8

Cómo convertir formatos de archivo con Pandoc en Linux [Guía rápida]

Cómo convertir una página web a PDF en Linux