Está la distribución rocks linux que está hecha para agrupar y se basa en CentOS/RHEL.
El punto fuerte de las rocas es que, en su mayor parte, manejará y hará muchas de las minucias por ti.
- Hará una instalación y una reinstalación automáticas, y si sus computadoras pueden iniciarse a través de PXE, la instalación inicial consistirá en que sus nodos se inicien mediante PXE. Si tiene una gran cantidad de nodos de cómputo, usan bittorrent internamente para distribuir paquetes, lo que elimina un cuello de botella significativo para (re)instalar todo.
- Te proporcionará un entorno informático muy homogéneo de forma predeterminada.
- De forma predeterminada, configurará y usará NFS internamente, y hay opciones para usar PVFS2 (que no he probado).
- En cuanto a los sistemas de colas/lotes, debería configurarlo y administrarlo por usted, de manera predeterminada, creo que usa SGE, también hay un rollo (su formato de paquete de software) para torque.
- Asegurará la consistencia en usuarios/grupos/etc. a través de su clúster
- Graficará la utilización de recursos a través de los ganglios
Si tuviera que desenterrar las desventajas
- Agregar/eliminar software de los nodos de cómputo implica reinstalarlos (aunque garantiza la homogeneidad).
- Agregar/eliminar software implica agregar un rollo (su forma de agrupar rpms/dispositivos) o editar archivos xml. Sin embargo, está bastante bien documentado, por lo que si está dispuesto a esforzarse en leer la documentación, debería estar bien. Además, hay una lista de correo por si te quedas atascado.
- Está basado en CentOS/RHEL, que está un poco por detrás de "Bleedingedge"
- Te obligará (principalmente) a hacer las cosas "a su manera", cambios menores con los que podrías salirte con la tuya tal vez modificando algunos de los archivos xml-config, es posible que los cambios importantes deban implementarse creando, agregando o modificando rollos (su formato sw/addon)
Tenemos un pequeño clúster que tiene openSUSE como distribución base, pero no creo que sea demasiado importante. Ubuntu parece una alternativa viable y tiene bastante documentación y soporte comunitario. Además de Linux, ejecutamos Sun Grid Engine (y nuestro clúster incluso incluye máquinas Mac OS sin problemas), pero slurm probablemente funcionaría para una configuración simple. Compartimos directorios de inicio y /usr/local a través de NFS desde un servidor central. Funciona bien para nosotros. Hay más detalles disponibles en nuestro sitio web (a través de Internet Archive).