GNU/Linux >> Tutoriales Linux >  >> Linux

Cómo eliminar palabras duplicadas de un archivo de texto sin formato usando el comando de Linux

Suponiendo que las palabras son una por línea y el archivo ya está ordenado:

uniq filename

Si el archivo no está ordenado:

sort filename | uniq

Si no son uno por línea y no te importa que sean uno por línea:

tr -s [:space:] \\n < filename | sort | uniq

Sin embargo, eso no elimina la puntuación, así que tal vez quieras:

tr -s [:space:][:punct:] \\n < filename | sort | uniq

Pero eso elimina el guión de las palabras con guión. "man tr" para más opciones.


ruby -pi.bak -e '$_.split(",").uniq.join(",")' filename ?

Admito que los dos tipos de citas son desagradables.


Linux
  1. Cómo escribir texto en la imagen usando el comando de Linux

  2. ¿Cómo eliminar líneas duplicadas dentro de un archivo de texto?

  3. 7 ejemplos de comandos Linux Uniq para eliminar líneas duplicadas del archivo

  4. Cómo dividir iso o archivo usando el comando 'dividir' en Linux

  5. ¿Cómo elimino líneas nuevas de un archivo de texto?

Cómo bloquear un archivo de texto en Linux usando el comando flock

Cómo imprimir líneas duplicadas en un archivo de texto en Linux

Cómo quitar un comando del historial en Linux

Cómo quitar líneas de un archivo usando el comando Sed

Cómo quitar (^M) caracteres de un archivo en Linux

Cómo quitar espacios de los nombres de archivo en Linux