Según el comm
manual, "Antes de que se pueda usar `comm', los archivos de entrada deben ordenarse usando la secuencia de clasificación especificada por la configuración regional `LC_COLLATE'".
Y el sort
manual:"A menos que se especifique lo contrario, todas las comparaciones utilizan la secuencia de clasificación de caracteres especificada por la configuración regional `LC_COLLATE'.
Por lo tanto, y una prueba rápida lo confirma, el LC_COLLATE
orden comm
espera es proporcionado por el sort
orden predeterminado de, clasificación por diccionario.
sort
puede ordenar archivos de varias maneras:
-d
:Orden del diccionario:ignora todo menos los espacios en blanco y los caracteres alfanuméricos.-g
:Número general:alfa, luego números negativos, luego positivos.-h
:Legible por humanos - negativo, alfa, positivo.n < nk = nK < nM < nG
-n
:Numérico - negativo, alfa, positivo.k
,M
,G
, etc. no son especiales.-V
:Versión - positivo, mayúsculas, inferior, negativo.1 < 1.2 < 1.10
-f
:No distingue entre mayúsculas y minúsculas.-R
:Aleatorio:mezcla la entrada.-r
:Inversa:generalmente se usa con uno dedghnV
Hay otras opciones, por supuesto, pero estas son las que probablemente veas o necesites.
Su prueba muestra que el orden de clasificación predeterminado es probablemente -d
, orden del diccionario.
d | g | h | n | V
------+-------+-------+-------+-------
1 | a | -1G | -10 | 1
-1 | A | -1k | -5 | 1G
10 | z | -10 | -1 | 1g
-10 | Z | -5 | -1g | 1k
1.10| -10 | -1 | -1G | 1.2
1.2 | -5 | -1g | -1k | 1.10
1g | -1 | a | a | 5
1G | -1g | A | A | 10
-1g | -1G | z | z | A
-1G | -1k | Z | Z | Z
1k | 1 | 1 | 1 | a
-1k | 1g | 1g | 1g | z
5 | 1G | 1.10 | 1G | -1
-5 | 1k | 1.2 | 1k | -1G
a | 1.10 | 5 | 1.10 | -1g
A | 1.2 | 10 | 1.2 | -1k
z | 5 | 1k | 5 | -5
Z | 10 | 1G | 10 | -10