Desde la versión 3.17 del kernel de Linux, los errores de ECC en E3 Xeons se pueden monitorear usando el ie31200_edac
controlador, introducido por este compromiso. Esto usa la interfaz EDAC estándar para que los errores se puedan enumerar usando edac-util
.
Con un poco más de detalle:
sudo modprobe ie31200-edac
carga el controlador, lo que resultará en líneas como
[ 14.635299] EDAC MC: Ver: 3.0.0
[ 14.637898] EDAC MC0: Giving out device to module ie31200_edac controller IE31200: DEV 0000:00:00.0 (POLLED)
que aparece en el registro del kernel (que está en un sistema C216 Haswell); entonces
edac-util
informará cualquier error.
Los controladores de memoria Xeon D, E5 y E7 son compatibles con el sb_edac
o skx_edac
módulos.