Intenta ordenar primero:
cat .temp_occ | sort| uniq -c | sort -k1,1nr -k2 > distribution.txt
O use "sort -u" que también elimina los duplicados. Ver aquí.
El tamaño del archivo no tiene nada que ver con lo que estás viendo. Desde la página man de uniq(1):
Nota:'uniq' no detecta líneas repetidas a menos que sean adyacentes. Es posible que desee ordenar la entrada primero o usar 'sort -u' sin 'uniq'. Además, las comparaciones respetan las reglas especificadas por 'LC_COLLATE'.`
Así que ejecuta uniq
en
a
b
a
devolverá:
a
b
a