Esta publicación ilustrará cómo RHEVM supervisa el estado del almacenamiento en detalle.
Supervisión del estado del administrador de grupos de almacenamiento
El Administrador de grupos de almacenamiento (SPM) es una función de administración asignada a uno de los hosts en un centro de datos que le permite administrar los dominios de almacenamiento del centro de datos. RHEVM comprueba la disponibilidad de SPM y la integridad de los metadatos cada 10 segundos de tasa de sondeo de SPM.
Puede verificar la configuración de esos motores de la siguiente manera. No se recomienda cambiar los siguientes parámetros a menos que lo recomiende el ingeniero de soporte para un caso de uso específico:
$ engine-config -g StoragePoolRefreshTimeInSeconds StoragePoolRefreshTimeInSeconds: 10 version: general $ engine-config -g SpmCommandFailOverRetries SpmCommandFailOverRetries: 3 version: general $ engine-config -g SPMFailOverAttempts SPMFailOverAttempts: 3 version: general $ engine-config -g DelayResetForSpmInSeconds DelayResetForSpmInSeconds: 20 version: general
Supervisión del estado del dominio de almacenamiento
El estado del dominio de almacenamiento es monitoreado tanto por el motor RHEVM como por KVM Vdsm.
1. RHEVM supervisa el dominio de almacenamiento
El intervalo de tiempo en segundos para sondear el estado de un Host por RHEVM es de 3 segundos de forma predeterminada. Durante el proceso, comprobará el estado de almacenamiento. Si el código de informes de getRepoStats es distinto de cero o lastcheck (statsGenTime – domStatus.checkTime) superior a MaxStorageVdsTimeoutCheckSec (30 segundos de forma predeterminada), entonces el dominio de almacenamiento se vuelve problemático y se inicia un temporizador para el dominio. El tiempo de espera de falla del dominio de almacenamiento es StorageDomainFailureTimeoutInMinutes (valor predeterminado de 5 minutos). Si el estado del dominio de almacenamiento problemático no se recupera durante este tiempo, el host se establecerá como no operativo. Si el dominio problemático se recupera durante el tiempo, RHEVM volverá a activar el host KVM automáticamente.
Aquí hay una configuración de motor relacionada:
$ engine-config -g VdsRefreshRate VdsRefreshRate: 3 version: general $ engine-config -g StorageDomainFailureTimeoutInMinutes StorageDomainFailureTimeoutInMinutes: 5 version: general $ engine-config -g MaxStorageVdsTimeoutCheckSec MaxStorageVdsTimeoutCheckSec: 30 version: general $ engine-config -g MaxStorageVdsDelayCheckSec MaxStorageVdsDelayCheckSec: 5 version: general
2. Salud del almacenamiento del monitor del host KVM:
Si el host KVM no puede acceder a los dominios de almacenamiento, dejará de estar operativo. Vdsm actualizará el almacenamiento con el intervalo de supervisión sd_health_check_delay. Invoca getStorageDomainStats para obtener dom.getStats el estado del dominio y devolver su estado a RHEVM a través de repoStats en _getDomsStats. Tanto repo_stats_cache_refresh_timeout como sd_health_check_delay se pueden configurar en /etc/vdsm/vdsm.conf .