GNU/Linux >> Tutoriales Linux >  >> Linux

Tolerancia a fallas de Linux:alta disponibilidad de Linux

El tiempo de inactividad de TI es costoso para cualquier empresa. Gartner[I] estima que cada minuto de tiempo de inactividad cuesta en promedio $5600, y los costos reales dependen de la vertical, el tamaño de la empresa y otros factores. Sin embargo, el costo se puede evitar en gran medida con sistemas diseñados para alta disponibilidad y tolerancia a fallas.

Definición:alta disponibilidadOracle[II] define la alta disponibilidad como "entornos informáticos configurados para proporcionar disponibilidad casi a tiempo completo". Un estándar común para la alta disponibilidad es "cinco nueves" o 99,999 por ciento de tiempo de actividad.

No todos los proveedores de servicios pueden cumplir con este sólido estándar, que hace que se permitan poco más de 5 minutos de tiempo de inactividad al año.

Para las organizaciones que se acercarían al costo promedio del tiempo de inactividad, lograr una disponibilidad aún mayor que "cinco nueves" es importante para la rentabilidad e incluso la supervivencia. Atlantic.net ofrece una garantía de tiempo de actividad de la red del 100 por ciento líder en la industria, en parte al aprovechar la alta disponibilidad de Linux (Linux-HA).

Introducción a la alta disponibilidad

Como explica Oracle, las redes se configuran para una alta disponibilidad mediante la utilización de hardware y software redundantes, y evitando los "puntos de falla" únicos para mantener el sistema en funcionamiento en caso de que surja un problema. Las cargas de trabajo se distribuyen entre las partes de la red mediante el balanceador de carga, que redirige el tráfico lejos de cualquier componente que haya fallado o se haya desconectado.

Los servidores agrupados para un funcionamiento unificado por el equilibrador de carga se conocen como clúster. Un sistema que sigue funcionando correctamente cuando falla uno de sus componentes se considera tolerante a fallos. El movimiento automático de tráfico o una carga de trabajo dentro del clúster para evitar una falla se denomina proceso de conmutación por error, y cuando se emplea, un usuario final puede continuar usando una aplicación incluso si el servidor en el que se encuentra falla.

El principal beneficio de los sistemas de alta disponibilidad es la reducción de costos por tiempo de inactividad no planificado. El equilibrio de carga no solo aumenta la confiabilidad, sino que también puede mejorar la velocidad de recuperación a través de la automatización y la detección de errores. Además, también puede mejorar el rendimiento de la aplicación.

"Incluso si una aplicación está mal escrita o tiene problemas de escalado, un balanceador de carga puede mejorar la experiencia del usuario sin ningún otro cambio".

NGINX[III]

La capacidad de actualizar los componentes del sistema sin desconectar todo el sistema también ayuda a garantizar que las tareas de mantenimiento, como las copias de seguridad y las actualizaciones, se realicen correctamente y no se apresuren a volver a funcionar. Los sistemas de alta disponibilidad brindan mayor protección al permitir que las organizaciones supervisen de manera proactiva su red y reduzcan el riesgo de pérdida de datos con almacenamiento redundante.

La alta disponibilidad también puede ser valiosa, o incluso necesaria, para garantizar el cumplimiento normativo, como el alojamiento compatible con HIPAA. La regla de seguridad de HIPAA[IV] requiere que "la información sea accesible y utilizable bajo demanda", así como un plan de contingencia para garantizar que permanezca así "durante eventos negativos inesperados", como una demanda inesperada o una falla de hardware.

Construyendo tolerancia a fallas en su red

Algunos productos de equilibrio de carga de uso común que pueden proporcionar tolerancia a fallas incluyen Apache Zookeeper, Pacemaker y HAProxy. Zookeeper[V] es un servicio de coordinación de código abierto para sistemas distribuidos que proporciona alta disponibilidad cuando se ejecuta en varios servidores. Se ejecuta en nodos de red en "conjuntos" impares y los coordina a través de un espacio de nombres de registros de datos que crea. Pacemaker[VI] es un administrador de recursos de clúster, también es de código abierto y originalmente era parte del proyecto Linux-HA, pero desde entonces se ha convertido en propio. También se ejecuta en los nodos y los coordina a través del servicio de infraestructura del clúster, como Heartbeat u OpenAIS.

HAProxy[VII], por el contrario, se incluye con el dispositivo Managed Firewall de Atlantic.Net.

La tolerancia a fallas es proporcionada por el control de recursos de red redundantes de HAProxy. Si un servidor falla, HAProxy utiliza uno de varios algoritmos que incluye para redirigir el tráfico lejos del problema y hacia el servidor redundante, que ha mantenido listo para este propósito. El cambio al nuevo servidor tarda aproximadamente un segundo, mientras que puede llevar horas poner en línea un servidor bloqueado. El costo de ese servidor redundante generalmente se ahorra en la reducción del tiempo de inactividad a los pocos minutos de que esto ocurra.

HAProxy no solo funciona para ayudar a su sitio en caso de que un servidor falle o deba desconectarse por mantenimiento, sino que también se puede configurar para equilibrar la carga de su tráfico web cuando ambos servidores están activos, lo que aumenta los tiempos de respuesta a sus clientes.

HAProxy también es de código abierto y ahora se envía con muchas distribuciones populares de Linux. La comunidad activa de HAProxy actualiza continuamente el software y se pueden implementar nuevas versiones sin reconfiguración. HAProxy sirve miles de millones de páginas web al día y mueve grandes cantidades de dinero para las empresas de Fortune 500, y no ha tenido errores en una versión estable (terminada) ni una sola intrusión conocida durante 13 años.

Mejores prácticas interrelacionadas

En un escenario en el que el tráfico de red malintencionado provoca un error, el equilibrio de carga generalmente no resolverá el problema por sí solo. El cortafuegos, que filtra el tráfico, evita que el problema simplemente siga la carga de trabajo hasta el nuevo servidor. Del mismo modo, el filtrado de tráfico del firewall hace poco para reducir la vulnerabilidad de la red a fallas de hardware o errores de software dentro de ella. El uso de un firewall sólido y un sistema de alta disponibilidad proporciona una mejora espectacular en la protección general.

Una red con redundancia integrada, con cargas de trabajo controladas por un balanceador de carga, tolera incluso las fallas en el peor de los casos y proporciona la máxima disponibilidad. Así como la combinación correcta de diferentes componentes garantiza la confiabilidad de la red, las organizaciones que se beneficiarían de la alta disponibilidad la lograrán mediante el uso de un balanceador de carga como HAProxy, junto con un conjunto completo de componentes de red redundantes.

Con las soluciones de hospedaje VPS de Atlantic.Net, nos aseguramos de que sus servidores estén configurados para alta disponibilidad a pedido. Combinado con nuestro dispositivo Managed Firewall, proporciona una solución confiable para evitar que su sitio se caiga cuando más lo necesita. Para obtener ayuda o más información, envíenos un correo electrónico a [email protected]. Nuestro equipo de ventas puede ayudarlo a guiarlo rápida y fácilmente a través del proceso.

[I] http://blogs.gartner.com/andrew-lerner/2014/07/16/the-cost-of-downtime/

[II] https://docs.oracle.com/cd/A91202_01/901_doc/rac.901/a89867/pshavdtl.htm

[III] https://www.nginx.com/blog/10-tips-for-10x-application-rendimiento/

[IV]https://www.hhs.gov/sites/default/files/ocr/privacy/hipaa/administrative/securityrule/securityrulepdf.pdf?language=es

[V] https://cwiki.apache.org/confluence/display/ZOOKEEPER/ProjectDescription

[VI] http://wiki.clusterlabs.org/wiki/Pacemaker

[VII] http://www.haproxy.org/


Linux
  1. Cómo configurar la conmutación por error y la vinculación de red de alta disponibilidad en Linux

  2. comando linux mv

  3. Linux du comando

  4. RCRON:configuración de alta disponibilidad de trabajos cron

  5. ¿Qué son la memoria alta y la memoria baja en Linux?

Cómo implementar un clúster tolerante a fallas con disponibilidad continua o alta

Keepalived y alta disponibilidad:temas avanzados

Cómo configurar un clúster de Pacemaker para Linux de alta disponibilidad

Alta disponibilidad de Pfsense

Linux frente a Unix

Hosting Humor:el papel de la tolerancia a fallas en la vida matrimonial