El asesino OOM sugiere que, de hecho, te has quedado sin memoria.
Si dice que tiene más memoria de la que necesita, es posible que algún evento del sistema esté creando una fuga de memoria en alguna parte, pero el asesino de OOM no dirá por qué hay una fuga de memoria, solo que se quedó sin memoria y ahora intenta eliminar las cosas menos importantes (basado en oom_score).
Y si el caso es que hay una fuga de memoria, entonces tal vez el oom-killer solo elimine los procesos para que el rouge pueda asignar más y más memoria.
Entonces, lo que haría en caso de que sea
- Configure kdump, que creará un vmcore de volcado por caída después de un pánico del kernel. (se describe más aquí)
- Configuración
vm.panic_on_oom=1
parámetro del núcleo. Esto provocará un pánico en el kernel si la máquina se queda sin memoria. - La próxima vez que entre en pánico, puede abrir el archivo vmcore creado por kdump y mirar la tabla de procesos, y revelará al culpable.