Esta publicación profundizará en la administración de energía de RHV.
¿Qué es la administración de energía del host (valla)?
Cuando se configura Power Management, RHV puede reiniciar los hosts que están en estado No operativo o No responde. RHV es compatible con los siguientes dispositivos de administración de energía:
- Conversión de energía estadounidense (apc)
- Bladecenter de IBM (Bladecenter)
- Sistema informático unificado de Cisco (cisco_ucs)
- Tarjeta de acceso remoto Dell 5 (drac5)
- Tarjeta de acceso remoto Dell 7 (drac7)
- Interruptor de encendido electrónico (eps)
- HP BladeSystem (hpblade)
- Apagado de luces integrado (ilo, ilo2, ilo3, ilo4, ilo_ssh)
- Interfaz de administración de plataforma inteligente (ipmilan)
- Adaptador de supervisor remoto (rsa)
- Fujitsu-Siemens RSB (rsb)
- Western Telematic, Inc (wti)
RHV utiliza agentes de cerca para comunicarse con los dispositivos de administración de energía.
¿Qué es el cercado automático?
Cuando el host experimenta una falla inesperada, el estado del host cambiará a conectando y el host permanecerá en este estado durante un período de gracia. Si transcurre este tiempo de espera, el host cambiará al estado "No responde" o "No operativo". Para reaccionar a ese estado, Engine cerca los hosts problemáticos reiniciando. El motor usa el agente de cercado para la tarjeta de administración de energía en el host para detener el host, confirmar que se detuvo, iniciar el host y confirmar que el host se inició.
Período de gracia de la valla automática:
De manera predeterminada, Engine intentará dos veces solicitar el estado de vdsm:
option_name | option_value | default_value -------------------------+--------------+--------------- VDSAttemptsToResetCount | 2 | 2 (1 row)
Grace Period = TimeoutToResetVdsInSeconds + DelayResetPerVmInSeconds*(Number of VMs on host) + DelayResetForSpmInSeconds(isSPM)
Por ejemplo, si el host es SPM con dos máquinas virtuales y valor_predeterminado, entonces el período de gracia =60+ 0,5*2+20=81 s
option_name | option_value | default_value ----------------------------+--------------+--------------- TimeoutToResetVdsInSeconds | 60 | 60 DelayResetForSpmInSeconds | 20 | 20 DelayResetPerVmInSeconds | 0.5 | 0.5 VDSAttemptsToResetCount | 2 | 2 (4 rows)
Cerca de descarga:
Al habilitar la "integración de Kdump", solo retrasa la valla dura hasta que el host termine de escribir su volcado de memoria en caso de un bloqueo.
Valla blanda:
Esto se puede configurar desde el nivel de clúster:
AdminPortal-->Compute-->Cluster-->Edit Cluster-->Fencing Polciy-->Enable Fencing
Antes de "reiniciar" el host, Engine intenta reiniciar VDSM a través de SSH en hosts "que no responden" mediante "SSH Soft Fencing".
option_name | option_value | default_value | version -----------------------+-------------------------------------------------+------------------------------------------------+--------- SshSoftFencingCommand | /usr/bin/vdsm-tool service-restart vdsmd | /usr/bin/vdsm-tool service-restart vdsmd | 4.3 (1 row)
La protección suave sobre SSH se puede ejecutar en hosts que no tienen configurada la administración de energía. Esto es distinto de "esgrima". El cercado solo se puede ejecutar en hosts que tengan configurada la administración de energía.
Selección de un proxy
La preferencia de proxy de administración de energía predeterminada es cluster, dc. Hay una opción para agregar "other_dc". Encontrará un host proxy en estado "UP".
# engine-config -g FenceProxyDefaultPreferences FenceProxyDefaultPreferences: cluster,dc version: general
Flujo:
Flujo del motor:
Metadatos de configuración
Estos son los metadatos de VdsFenceType, VdsFenceOptionTypes, VdsFenceOptionMapping, FenceAgentMapping y FenceAgentDefaultParams:
-[ RECORD 1 ]+---------------------------------------------------------------------------------------------------------- option_name | VdsFenceType option_value | apc,apc_snmp,bladecenter,cisco_ucs,drac5,drac7,eps,hpblade,ilo,ilo2,ilo3,ilo4,ilo_ssh,ipmilan,rsa,rsb,wti version | 4.3 -[ RECORD 2 ]-+--------------------------------------------------------------------------------------------------------- option_name | VdsFenceOptionTypes option_value | encrypt_options=bool,secure=bool,port=int,slot=int default_value | encrypt_options=bool,secure=bool,port=int,slot=int -[ RECORD 3 ]-+---------------------------------------------------------------------------------------------------------- option_name | VdsFenceOptionMapping option_value | apc:secure=secure,port=ipport,slot=port; apc_snmp:port=port,encrypt_options=encrypt_options; bladecenter:secure=secure,port=ipport,slot=port; cisco_ucs:secure=ssl,slot=port; drac5:secure=secure,slot=port; drac7:;eps:slot=port; hpblade:port=port; ilo:secure=ssl,port=ipport; ipmilan:; ilo2:secure=ssl,port=ipport; ilo3:; ilo4:; ilo_ssh:port=port; rsa:secure=secure,port=ipport; rsb:;wti:secure=secure,port=ipport,slot=port default_value | apc:secure=secure,port=ipport,slot=port; apc_snmp:port=port,encrypt_options=encrypt_options; bladecenter:secure=secure,port=ipport,slot=port; cisco_ucs:secure=ssl,slot=port; drac5:secure=secure,slot=port; drac7:; eps:slot=port; hpblade:port=port; ilo:secure=ssl,port=ipport; ipmilan:; ilo2:secure=ssl,port=ipport; ilo3:; ilo4:; ilo_ssh:port=port; rsa:secure=secure,port=ipport; rsb:; wti:secure=secure,port=ipport,slot=port -[ RECORD 4 ]-+---------------------------------------------------------------------------------------------- option_name | FenceAgentMapping option_value | drac7=ipmilan,ilo2=ilo default_value | drac7=ipmilan,ilo2=ilo -[ RECORD 5 ]-+----------------------------------------------------------------------------------------------- option_name | FenceAgentDefaultParams option_value | drac7:privlvl=OPERATOR,lanplus=1,delay=10;ilo3:power_wait=4;ilo4:power_wait=4;ilo_ssh:secure=1 default_value | drac7:privlvl=OPERATOR,lanplus=1,delay=10;ilo3:power_wait=4;ilo4:power_wait=4;ilo_ssh:secure=1
Los metadatos anteriores se pueden configurar en la configuración del motor:
# engine-config -a |grep 'CustomFence\|CustomVdsFence' CustomFenceAgentMapping: version: general CustomFenceAgentDefaultParams: version: general CustomFenceAgentDefaultParamsForPPC: version: general CustomVdsFenceOptionMapping: version: general CustomVdsFenceType: version: general CustomFencePowerWaitParam: version: general
Otra configuración (tiempos de espera y reintentos):
# engine-config -a |grep 'FenceStart\|FenceStop' FenceStartStatusRetries: 18 version: general FenceStartStatusDelayBetweenRetriesInSec: 10 version: general FenceStopStatusRetries: 18 version: general FenceStopStatusDelayBetweenRetriesInSec: 10 version: general