GNU/Linux >> Tutoriales Linux >  >> Linux

¿Cómo contar el número de valores únicos de un campo en un archivo de texto delimitado por tabuladores?

Puedes hacer uso de cut , sort y uniq comandos de la siguiente manera:

cat input_file | cut -f 1 | sort | uniq

obtiene valores únicos en el campo 1, reemplazar 1 por 2 le dará valores únicos en el campo 2.

Evitar UUOC :)

cut -f 1 input_file | sort | uniq

EDITAR:

Para contar el número de ocurrencias únicas, puede utilizar wc comando en la cadena como:

cut -f 1 input_file | sort | uniq | wc -l

awk -F '\t' '{ a[$1]++ } END { for (n in a) print n, a[n] } ' test.csv

Puede usar awk, sort &uniq para hacer esto, por ejemplo, para enumerar todos los valores únicos en la primera columna

awk < test.txt '{print $1}' | sort | uniq

Como se publicó en otro lugar, si desea contar la cantidad de instancias de algo, puede canalizar la lista única a wc -l


Linux
  1. ¿Usando Uniq en texto Unicode?

  2. ¿Cómo contar el número de líneas en un archivo después de una coincidencia Grep?

  3. Cómo contar el número de líneas en un archivo en Linux (ejemplos de comandos wc y nl)

  4. ¿Cómo canalizo una llamada de subproceso a un archivo de texto?

  5. ¿Cómo ordenar un archivo, en función de sus valores numéricos para un campo?

Cómo contar las apariciones de palabras en un archivo de texto

Cómo crear directorios desde un archivo de texto en Linux

Cómo agregar texto al comienzo del archivo en Linux

5 formas de contar el número de líneas en un archivo

¿Cómo encontrar corchetes no coincidentes en un archivo de texto?

Cómo editar un archivo de texto en mi terminal