El problema
El módulo RDS no se carga después de reiniciar los nodos del clúster. Por lo tanto, el CRS no puede ejecutarse en ninguno de los nodos. Al intentar cargar el módulo se muestran los siguientes errores:
# modprobe rds_rdma FATAL: Error inserting rds_rdma /lib/modules/2.6.18-274.18.1.0.1.el5/updates/net/rds/rds_rdma.ko): Unknown symbol in module, or unknown parameter (see dmesg)
La salida de dmesg muestra las siguientes entradas:
rds_rdma: Unknown symbol rds_cong_map_updated rds_rdma: Unknown symbol rds_conn_drop rds_rdma: Unknown symbol rds_message_addref rds_rdma: Unknown symbol rds_trans_unregister rds_rdma: Unknown symbol rds_info_deregister_func rds_rdma: Unknown symbol rds_send_get_message rds_rdma: Unknown symbol rds_for_each_conn_info rds_rdma: Unknown symbol rds_message_add_rdma_dest_extension rds_rdma: Unknown symbol rds_wq rds_rdma: Unknown symbol rds_atomic_send_complete rds_rdma: Unknown symbol rds_conn_connect_if_down rds_rdma: Unknown symbol rds_conn_destroy
Cuando surge este problema. El daemon "ccsd" de Cluster Synchronization Services (CSS) no se iniciará, por lo que no permitirá que GI se inicie por completo. Las siguientes entradas se registran en el archivo de seguimiento del daemon de Cluster Synchronization Services (CSS) “ocssd.trc”
2017-10-25 20:13:23.776120 : SKGFD:922437376: ERROR: -8(OS Error -1 (open,sskgxplp,Invalid protocol requested (2) or protocol not loaded.,Error 0) 2017-10-25 20:13:23.776127 : SKGFD:922437376: ERROR: -10(OSS Operation oss_initialize failed with error 4 [Network initialization failed]
La solución
El problema se debe a que la línea "install rds /bin/true ” que aparece en /etc/modprobe.d/network.conf El archivo funciona de manera similar a una lista negra de ese módulo, pero con mayor prioridad.
La solución al problema es realizar cualquiera de las siguientes acciones, cuyo objetivo principal es deshacerse de "install rds /bin/true" para que el módulo pueda cargarse después de cada reinicio del sistema.
1. Quite el archivo /etc/modprobe.d/network.conf o muévalo a otro directorio como /tmp.
o
2. Comentando la línea en /etc/modprobe.d/network.conf como en el siguiente ejemplo
# install rds /bin/true
Luego, podemos proceder simplemente a reiniciar el sistema y asegurarnos de que rds esté cargado después de reiniciar, si rds no está cargado, cargue el módulo ejecutando:
# modprobe rds_rdma
o
Ejecute los siguientes comandos:
# depmod -ae current_kernel_version_running -------> for example 2.6.18-274.18.1.0.1.el5 # modprobe rds_rdma # reboot
Una vez que el módulo rds se haya cargado correctamente, se puede iniciar CRS en todos los nodos del clúster.
Nota:el nombre del archivo en "/etc/modprobe.d/" para el módulo rds depende de lo que el usuario quiera usar. es decir:"red.conf" o "rds.conf"