GNU/Linux >> Tutoriales Linux >  >> Linux

12 comandos útiles para filtrar texto para operaciones de archivo efectivas en Linux

En este artículo, revisaremos una serie de herramientas de línea de comandos que actúan como filtros en Linux. Un filtro es un programa que lee la entrada estándar, realiza una operación sobre ella y escribe los resultados en la salida estándar.

Por esta razón, se puede usar para procesar información de manera poderosa, como reestructurar la salida para generar informes útiles, modificar texto en archivos y muchas otras tareas de administración del sistema.

Dicho esto, a continuación se muestran algunos de los filtros de archivos o texto útiles en Linux.

1. Comando Awk

Qué raro es un notable lenguaje de escaneo y procesamiento de patrones, puede usarse para construir filtros útiles en Linux. Puede comenzar a usarlo leyendo nuestra serie Awk, de la Parte 1 a la Parte 13.

Además, lea también el awk página man para obtener más información y opciones de uso:

$ man awk

2. Comando Sed

sed es un poderoso editor de secuencias para filtrar y transformar texto. Ya hemos escrito dos artículos útiles sobre sed, que puede leer aquí:

  1. Cómo usar el comando GNU 'sed' para crear, editar y manipular archivos en Linux
  2. 15 consejos y trucos útiles del comando 'sed' para las tareas diarias de administración del sistema Linux

La página man de sed ha agregado opciones de control e instrucciones:

$ man sed

3. Comandos Grep, Egrep, Fgrep, Rgrep

Estos filtros generan líneas que coinciden con un patrón dado. Leen líneas de un archivo o entrada estándar e imprimen todas las líneas coincidentes de forma predeterminada en la salida estándar.

Nota :El programa principal es grep, las variaciones son simplemente las mismas que usar opciones específicas de grep como se muestra a continuación (y todavía se usan para compatibilidad con versiones anteriores):

$ egrep = grep -E
$ fgrep = grep -F
$ rgrep = grep -r  

A continuación se muestran algunos comandos grep básicos:

[email protected] ~ $ grep "aaronkilik" /etc/passwd
aaronkilik:x:1001:1001::/home/aaronkilik:

[email protected] ~ $ cat /etc/passwd | grep "aronkilik"
aaronkilik:x:1001:1001::/home/aaronkilik:

Puede leer más sobre ¿Cuál es la diferencia entre Grep, Egrep y Fgrep en Linux?.

4. Comando principal

cabeza se utiliza para mostrar las primeras partes de un archivo, genera los primeros 10 líneas por defecto. Puede usar el -n indicador de número para especificar el número de líneas que se mostrarán:

[email protected] ~ $ head /var/log/auth.log  
Jan  2 10:45:01 TecMint CRON[3383]: pam_unix(cron:session): session opened for user root by (uid=0)
Jan  2 10:45:01 TecMint CRON[3383]: pam_unix(cron:session): session closed for user root
Jan  2 10:51:34 TecMint sudo:  tecmint : TTY=unknown ; PWD=/home/tecmint ; USER=root ; COMMAND=/usr/lib/linuxmint/mintUpdate/checkAPT.py
Jan  2 10:51:34 TecMint sudo: pam_unix(sudo:session): session opened for user root by (uid=0)
Jan  2 10:51:39 TecMint sudo: pam_unix(sudo:session): session closed for user root
Jan  2 10:55:01 TecMint CRON[4099]: pam_unix(cron:session): session opened for user root by (uid=0)
Jan  2 10:55:01 TecMint CRON[4099]: pam_unix(cron:session): session closed for user root
Jan  2 11:05:01 TecMint CRON[4138]: pam_unix(cron:session): session opened for user root by (uid=0)
Jan  2 11:05:01 TecMint CRON[4138]: pam_unix(cron:session): session closed for user root
Jan  2 11:09:01 TecMint CRON[4146]: pam_unix(cron:session): session opened for user root by (uid=0)

[email protected] ~ $ head  -n 5 /var/log/auth.log  
Jan  2 10:45:01 TecMint CRON[3383]: pam_unix(cron:session): session opened for user root by (uid=0)
Jan  2 10:45:01 TecMint CRON[3383]: pam_unix(cron:session): session closed for user root
Jan  2 10:51:34 TecMint sudo:  tecmint : TTY=unknown ; PWD=/home/tecmint ; USER=root ; COMMAND=/usr/lib/linuxmint/mintUpdate/checkAPT.py
Jan  2 10:51:34 TecMint sudo: pam_unix(sudo:session): session opened for user root by (uid=0)
Jan  2 10:51:39 TecMint sudo: pam_unix(sudo:session): session closed for user root

Aprenda a usar el comando de cabeza con los comandos de cola y gato para un uso efectivo en Linux.

5. Comando de cola

cola genera las últimas partes (10 líneas por defecto) de un archivo. Usa el -n interruptor numérico para especificar el número de líneas que se mostrarán.

El siguiente comando generará los últimos 5 líneas del archivo especificado:

[email protected] ~ $ tail -n 5 /var/log/auth.log
Jan  6 13:01:27 TecMint sshd[1269]: Server listening on 0.0.0.0 port 22.
Jan  6 13:01:27 TecMint sshd[1269]: Server listening on :: port 22.
Jan  6 13:01:27 TecMint sshd[1269]: Received SIGHUP; restarting.
Jan  6 13:01:27 TecMint sshd[1269]: Server listening on 0.0.0.0 port 22.
Jan  6 13:01:27 TecMint sshd[1269]: Server listening on :: port 22.

Además, cola tiene una opción especial -f para ver cambios en un archivo en tiempo real (especialmente archivos de registro).

El siguiente comando le permitirá monitorear los cambios en el archivo especificado:

[email protected] ~ $ tail -f /var/log/auth.log
Jan  6 12:58:01 TecMint sshd[1269]: Server listening on :: port 22.
Jan  6 12:58:11 TecMint sshd[1269]: Received SIGHUP; restarting.
Jan  6 12:58:12 TecMint sshd[1269]: Server listening on 0.0.0.0 port 22.
Jan  6 12:58:12 TecMint sshd[1269]: Server listening on :: port 22.
Jan  6 13:01:27 TecMint sshd[1269]: Received SIGHUP; restarting.
Jan  6 13:01:27 TecMint sshd[1269]: Server listening on 0.0.0.0 port 22.
Jan  6 13:01:27 TecMint sshd[1269]: Server listening on :: port 22.
Jan  6 13:01:27 TecMint sshd[1269]: Received SIGHUP; restarting.
Jan  6 13:01:27 TecMint sshd[1269]: Server listening on 0.0.0.0 port 22.
Jan  6 13:01:27 TecMint sshd[1269]: Server listening on :: port 22.

Leer a través de la cola página de manual para obtener una lista completa de las opciones de uso e instrucciones:

$ man tail

6. Ordenar Comando

ordenar se utiliza para ordenar líneas de un archivo de texto o de entrada estándar.

A continuación se muestra el contenido de un archivo llamado domains.list :

[email protected] ~ $ cat domains.list
tecmint.com
tecmint.com
news.tecmint.com
news.tecmint.com
linuxsay.com
linuxsay.com
windowsmint.com
windowsmint.com

Puede ejecutar un comando de ordenación simple para ordenar el contenido del archivo de la siguiente manera:

[email protected] ~ $ sort domains.list
linuxsay.com
linuxsay.com
news.tecmint.com
news.tecmint.com
tecmint.com
tecmint.com
windowsmint.com
windowsmint.com

Puedes usar ordenar comando de muchas maneras, revise algunos de los artículos útiles sobre el comando de clasificación de la siguiente manera:

  1. 14 ejemplos útiles del comando 'sort' de Linux - Parte 1
  2. 7 ejemplos interesantes de comandos "sort" de Linux - Parte 2
  3. Cómo buscar y ordenar archivos según la fecha y la hora de modificación
  4. Cómo ordenar la salida del comando 'ls' por fecha y hora de última modificación

7. Comando único

uniq El comando se usa para informar u omitir líneas repetidas, filtra líneas de la entrada estándar y escribe el resultado en la salida estándar.

Después de ejecutar ordenar en un flujo de entrada, puede eliminar líneas repetidas con uniq como en el ejemplo a continuación.

Para indicar el número de ocurrencias de una línea, use -c opción e ignorar las diferencias en el caso al comparar incluyendo el -i opción:

[email protected] ~ $ cat domains.list
tecmint.com
tecmint.com
news.tecmint.com
news.tecmint.com
linuxsay.com
linuxsay.com
windowsmint.com

[email protected] ~ $ sort domains.list | uniq -c 
2 linuxsay.com
2 news.tecmint.com
2 tecmint.com
1 windowsmint.com 

Lea el uniq página de manual para más información de uso y banderas:

$ man uniq

8. Comando fmt

fmt formateador de texto óptimo simple, reformatea los párrafos en el archivo especificado e imprime los resultados en la salida estándar.

El siguiente es el contenido extraído del archivo domain-list.txt :

1.tecmint.com 2.news.tecmint.com 3.linuxsay.com 4.windowsmint.com

Para reformatear el contenido anterior a una lista estándar, ejecute el siguiente comando con -w el interruptor se usa para definir el ancho de línea máximo:

tecmint[email protected] ~ $ cat domain-list.txt 
1.tecmint.com 2.news.tecmint.com 3.linuxsay.com 4.windowsmint.com

[email protected] ~ $ fmt -w 1 domain-list.txt
1.tecmint.com 
2.news.tecmint.com 
3.linuxsay.com 
4.windowsmint.com

9. pr Comando

pr El comando convierte archivos de texto o entrada estándar para imprimir. Por ejemplo, en Debian sistemas, puede enumerar todos los paquetes instalados de la siguiente manera:

$ dpkg -l

Para organizar la lista en páginas y columnas listas para imprimir, emita el siguiente comando.

[email protected] ~ $ dpkg -l | pr --columns 3 -l 20  

2017-01-06 13:19                                                  Page 1


Desired=Unknown/Install ii  adduser		ii  apg
| Status=Not/Inst/Conf- ii  adwaita-icon-theme	ii  app-install-data
|/ Err?=(none)/Reinst-r ii  adwaita-icon-theme- ii  apparmor
||/ Name		ii  alsa-base		ii  apt
+++-=================== ii  alsa-utils		ii  apt-clone
ii  accountsservice	ii  anacron		ii  apt-transport-https
ii  acl			ii  apache2		ii  apt-utils
ii  acpi-support	ii  apache2-bin		ii  apt-xapian-index
ii  acpid		ii  apache2-data	ii  aptdaemon
ii  add-apt-key		ii  apache2-utils	ii  aptdaemon-data


2017-01-06 13:19                                                  Page 2


ii  aptitude		ii  avahi-daemon	ii  bind9-host
ii  aptitude-common	ii  avahi-utils		ii  binfmt-support
ii  apturl		ii  aview		ii  binutils
ii  apturl-common	ii  banshee		ii  bison
ii  archdetect-deb	ii  baobab		ii  blt
ii  aspell		ii  base-files		ii  blueberry
ii  aspell-en		ii  base-passwd		ii  bluetooth
ii  at-spi2-core	ii  bash		ii  bluez
ii  attr		ii  bash-completion	ii  bluez-cups
ii  avahi-autoipd	ii  bc			ii  bluez-obexd

.....

Las banderas utilizadas aquí son:

  1. --column define el número de columnas creadas en la salida.
  2. -l especifica la longitud de la página (el valor predeterminado es 66 líneas).

10. Comando tr

Esta herramienta traduce o elimina caracteres de la entrada estándar y escribe los resultados en la salida estándar.

La sintaxis para usar tr es el siguiente:

$ tr options set1 set2

Eche un vistazo a los ejemplos a continuación, en el primer comando, set1( [:upper:] ) representa el caso de los caracteres de entrada (todos en mayúsculas).

Entonces set2([:lower:]) representa el caso en el que se encontrarán los caracteres resultantes. Es lo mismo en el segundo ejemplo y la secuencia de escape \n significa salida de impresión en una nueva línea:

[email protected] ~ $ echo "WWW.TECMINT.COM" | tr [:upper:] [:lower:]
www.tecmint.com

[email protected] ~ $ echo "news.tecmint.com" | tr [:lower:] [:upper:]
NEWS.TECMINT.COM

11. más Comando

más El comando es un filtro de lectura de archivos útil creado básicamente para la visualización de certificados. Muestra el contenido del archivo en un formato similar a una página, donde los usuarios pueden presionar [Enter] para ver más información.

Puede usarlo para ver archivos grandes como este:

[email protected] ~ $ dmesg | more
[    0.000000] Initializing cgroup subsys cpuset
[    0.000000] Initializing cgroup subsys cpu
[    0.000000] Initializing cgroup subsys cpuacct
[    0.000000] Linux version 4.4.0-21-generic ([email protected]) (gcc version 5.3.1 20160413 (Ubuntu 5.3.1-14ubuntu2) ) #37-Ubuntu SMP Mon Apr 18 18:33:37 UTC 2016 (Ubuntu 4.4.0-21.37-generic
 4.4.6)
[    0.000000] Command line: BOOT_IMAGE=/boot/vmlinuz-4.4.0-21-generic root=UUID=bb29dda3-bdaa-4b39-86cf-4a6dc9634a1b ro quiet splash vt.handoff=7
[    0.000000] KERNEL supported cpus:
[    0.000000]   Intel GenuineIntel
[    0.000000]   AMD AuthenticAMD
[    0.000000]   Centaur CentaurHauls
[    0.000000] x86/fpu: xstate_offset[2]:  576, xstate_sizes[2]:  256
[    0.000000] x86/fpu: Supporting XSAVE feature 0x01: 'x87 floating point registers'
[    0.000000] x86/fpu: Supporting XSAVE feature 0x02: 'SSE registers'
[    0.000000] x86/fpu: Supporting XSAVE feature 0x04: 'AVX registers'
[    0.000000] x86/fpu: Enabled xstate features 0x7, context size is 832 bytes, using 'standard' format.
[    0.000000] x86/fpu: Using 'eager' FPU context switches.
[    0.000000] e820: BIOS-provided physical RAM map:
[    0.000000] BIOS-e820: [mem 0x0000000000000000-0x000000000009d3ff] usable
[    0.000000] BIOS-e820: [mem 0x000000000009d400-0x000000000009ffff] reserved
[    0.000000] BIOS-e820: [mem 0x00000000000e0000-0x00000000000fffff] reserved
[    0.000000] BIOS-e820: [mem 0x0000000000100000-0x00000000a56affff] usable
[    0.000000] BIOS-e820: [mem 0x00000000a56b0000-0x00000000a5eaffff] reserved
[    0.000000] BIOS-e820: [mem 0x00000000a5eb0000-0x00000000aaabefff] usable
--More--

12. menos Comando

menos es lo contrario de más comando anterior, pero ofrece funciones adicionales y es un poco más rápido con archivos grandes.

Úselo de la misma manera que más:

[email protected] ~ $ dmesg | less
[    0.000000] Initializing cgroup subsys cpuset
[    0.000000] Initializing cgroup subsys cpu
[    0.000000] Initializing cgroup subsys cpuacct
[    0.000000] Linux version 4.4.0-21-generic ([email protected]) (gcc version 5.3.1 20160413 (Ubuntu 5.3.1-14ubuntu2) ) #37-Ubuntu SMP Mon Apr 18 18:33:37 UTC 2016 (Ubuntu 4.4.0-21.37-generic
 4.4.6)
[    0.000000] Command line: BOOT_IMAGE=/boot/vmlinuz-4.4.0-21-generic root=UUID=bb29dda3-bdaa-4b39-86cf-4a6dc9634a1b ro quiet splash vt.handoff=7
[    0.000000] KERNEL supported cpus:
[    0.000000]   Intel GenuineIntel
[    0.000000]   AMD AuthenticAMD
[    0.000000]   Centaur CentaurHauls
[    0.000000] x86/fpu: xstate_offset[2]:  576, xstate_sizes[2]:  256
[    0.000000] x86/fpu: Supporting XSAVE feature 0x01: 'x87 floating point registers'
[    0.000000] x86/fpu: Supporting XSAVE feature 0x02: 'SSE registers'
[    0.000000] x86/fpu: Supporting XSAVE feature 0x04: 'AVX registers'
[    0.000000] x86/fpu: Enabled xstate features 0x7, context size is 832 bytes, using 'standard' format.
[    0.000000] x86/fpu: Using 'eager' FPU context switches.
[    0.000000] e820: BIOS-provided physical RAM map:
[    0.000000] BIOS-e820: [mem 0x0000000000000000-0x000000000009d3ff] usable
[    0.000000] BIOS-e820: [mem 0x000000000009d400-0x000000000009ffff] reserved
[    0.000000] BIOS-e820: [mem 0x00000000000e0000-0x00000000000fffff] reserved
[    0.000000] BIOS-e820: [mem 0x0000000000100000-0x00000000a56affff] usable
[    0.000000] BIOS-e820: [mem 0x00000000a56b0000-0x00000000a5eaffff] reserved
[    0.000000] BIOS-e820: [mem 0x00000000a5eb0000-0x00000000aaabefff] usable
:

Descubra por qué el comando "menos" es más rápido que el comando "más" para una navegación de archivos eficaz en Linux.

Eso es todo por ahora, infórmenos sobre cualquier herramienta de línea de comando útil que no se mencione aquí, que actúe como un filtro de texto en Linux a través de la sección de comentarios a continuación.


Linux
  1. 8 comandos de Linux para una gestión de procesos eficaz

  2. 10 comandos de Linux para diagnóstico de red

  3. 3 comandos de Linux imprescindibles para la manipulación de texto

  4. 3 comandos útiles de Linux para administradores de sistemas

  5. ¿Se puede usar el comando linux cat para escribir texto en un archivo?

40 comandos git útiles para administradores y desarrolladores de Linux

Los 50 comandos Zypper más útiles para usuarios de SUSE Linux

Los 50 comandos IP útiles de Linux para administradores de red

14 comandos básicos de Tar en Linux con ejemplos para principiantes

4 Comandos Stat en Linux con Ejemplo para Usuarios Principiantes

Comandos prácticos de Linux y Unix Tee para el administrador de Linux