GNU/Linux >> Tutoriales Linux >  >> Linux

RAID para los que lo evitan

Todo el hardware finalmente falla. Este es uno de los dolorosos efectos secundarios de la entropía en nuestro universo. Para la mayoría de los tipos de hardware que se utilizan en la infraestructura moderna, la pérdida de un solo componente suele generar cierto tiempo de inactividad. Aparte del tiempo que se tarda en cambiar algo como una CPU defectuosa o una barra de RAM, los administradores de sistemas o los usuarios rara vez ven muchos efectos nocivos a largo plazo. Pero a menos que un administrador tenga especial cuidado con el almacenamiento, la pérdida de datos por fallas en el disco puede tener consecuencias inmediatas y duraderas.

Tome el escritorio de un usuario como ejemplo:si almacenan sus datos localmente en una sola unidad, cuando la unidad falle inevitablemente, sus datos se perderán. Lo mismo es cierto sin importar la calidad, la marca o el tipo de unidad. Por supuesto, hay equipos de recuperación de datos que estarían encantados de aceptar el dinero ganado con tanto esfuerzo a cambio de la posibilidad de resucitar bits de unidades muertas. Desafortunadamente, el costo rápidamente se vuelve exorbitante, e incluso esos especialistas se quedan cortos en algún momento.

Los administradores tienen una serie de opciones a su disposición para evitar un desastre inminente:RAID, copias de seguridad, clústeres de almacenamiento en red, etc. A menudo, estas opciones se usan en conjunto para proporcionar capas de protección de datos y múltiples oportunidades para detener un problema antes de que se convierta en demasiado. tarde. Crear matrices redundantes de discos y abstraer el almacenamiento de unidades individuales es la forma más sencilla y mejor de eliminar estos puntos únicos de falla. El objetivo es evitar las noches largas y los fines de semana largos restaurando a partir de copias de seguridad (que, con suerte, alguien ha estado haciendo), o pagar las tarifas extremas a las empresas de recuperación.

¿Qué es RAID?

Las matrices redundantes de discos económicos (RAID) son una de las tecnologías de almacenamiento más utilizadas y efectivas con las que se encontrará un administrador de sistemas. Sentirse cómodo con sus implementaciones más comunes es vital. RAID se puede ofrecer como una solución de software a través de una utilidad del sistema operativo como mdadm en Linux, un controlador RAID de hardware como la línea de tarjetas MegaRAID, o incluso conjuntos de chips que brindan capacidades pseudo-RAID. Sin embargo, los controladores de hardware como los de la línea MegaRAID no deben confundirse con los adaptadores de bus de host (HBA), ya que están diseñados para un acceso simple y directo a los discos. Los HBA existen como una forma de proporcionar conectividad sin la inteligencia del controlador RAID y, por lo tanto, son mucho menos costosos.

En un nivel alto, el concepto de RAID es agrupar una colección de unidades en una matriz para escribir datos en ellas. Según la configuración, los datos se escribirán de diferentes maneras, con diferentes cantidades de información de paridad para ayudar a reconstruir los datos en caso de que falle la unidad. Si bien es posible utilizar diferentes tipos, velocidades, tamaños o conexiones para unidades en un arreglo, es mejor hacer que coincidan tanto como sea posible. Las unidades de diferentes tamaños casi siempre terminan reduciéndose al mínimo común denominador, y las unidades de diferentes velocidades tienen que esperar a la más lenta.

Sin embargo, muchos administradores prefieren comprar unidades de diferentes fabricantes para evitar lotes defectuosos de unidades que provoquen fallas simultáneas entre los miembros de los arreglos.

Niveles de RAID

Debido a que las configuraciones de RAID se nombran en niveles, el esquema de numeración implica una escala lineal de progresión de una configuración a otra, aunque muchos de los niveles no están relacionados entre sí. Cada nivel de RAID tiene ventajas y desventajas, y algunos niveles son más útiles que otros. En el mundo real, los niveles más comunes son 0, 1, 5, 6, 10, 50 y 60. También existen los niveles de RAID 2, 3, 4 y algunos otros, pero son propietarios, están obsoletos o rara vez se usan. Puede parecer mucho, pero cuando se desglosa, esta información se digiere más fácilmente.

INCURSIÓN 0

La mayoría de los niveles de RAID se ajustan a un determinado caso de uso. Comenzando con RAID 0, encontramos que está diseñado sin tener en cuenta la redundancia interna, ya que cada disco proporciona su capacidad total a la matriz como almacenamiento utilizable. Debido a que los datos se dividen y escriben en todos los discos en paralelo, vemos un beneficio. Cuando se realizan lecturas y escrituras en una matriz configurada de esta manera, pueden ser muy rápidas, ya que se escala linealmente a la cantidad de discos incluidos en la matriz.

Técnicamente, aunque puede convertir un solo disco en una matriz RAID 0, realmente estaría haciendo esto con al menos un par de discos. La principal desventaja de RAID 0, en general, es que si se pierde un solo disco, todo el arreglo fallará y los datos se perderán. Esta configuración no es adecuada para uso de producción donde los datos no viven en otro sistema de fácil acceso. Sin embargo, RAID 0 puede ser una configuración perfectamente razonable para una estación de trabajo de usuario final que necesita un alto rendimiento, donde esa estación de trabajo no es el único hogar para los datos en los que se trabaja.

INCURSIÓN 1

RAID 1 se diseñó con un objetivo totalmente diferente al de RAID 0. En lugar de fragmentar los datos en un conjunto de unidades para obtener velocidad sin ninguna protección, RAID 1 brinda al administrador la capacidad de duplicar datos en dos o más unidades para mayor resistencia. Este nivel de RAID hace esto para proporcionar una copia local (o copias) de datos para ayudar en caso de que falle una sola unidad, y utiliza datos de unidades en buen estado para reconstruir datos después de ser reemplazados.

Por lo general, los espejos RAID 1 consisten en un par de unidades, pero pueden contener tres o más, según la cantidad de copias de bloques que el administrador requiera tener en línea. Lo que es importante señalar es que esto no Una copia de seguridad. Estos datos existen como una copia en vivo de la unidad en un sistema y no brindan las garantías de un sistema de respaldo regular. Estos espejos son clones 1:1, por lo que las unidades deben tener el mismo tamaño o se perderá espacio para acomodar la unidad más pequeña del conjunto.

Independientemente de la cantidad de discos agregados a una matriz RAID 1, la capacidad total permanece igual. Esa capacidad es del tamaño de un solo disco en la matriz (el más pequeño, si no son idénticos), pero la cantidad de copias de datos aumenta con cada disco adicional sin que aumente la capacidad general. Cada disco es otro clon de los datos, lo que brinda mayor protección contra fallas de unidades individuales.

Existen límites sobre la cantidad de discos que se pueden agregar a una matriz, según el software que se utilice y/o el controlador al que están conectados.

RAID 2 a 4

Los niveles de RAID 2, 3 y 4 son obsoletos, propietarios o muy raros. Es poco probable que muchos administradores de sistemas se ejecuten en sistemas que ejecutan cualquiera de estas tres configuraciones y, en circunstancias normales, pueden ignorarse de manera efectiva. Si se encuentra trabajando en un sistema que ejecuta alguno de estos, lo mejor que puede hacer es leer la documentación del proveedor para averiguar cuál es la mejor manera de administrarlo.

INCURSIÓN 5

Más allá de usar RAID 0 para dividir datos en una colección de unidades sin protección, o usar RAID 1 para obtener algo de redundancia pero limitando la capacidad, RAID 5 ofrece un excelente término medio con la escritura de datos en varias unidades al tiempo que brinda un nivel de redundancia a la matriz. . RAID 5 hace esto al escribir información de paridad en cada unidad para que pueda reconstruir los datos desde cualquier unidad individual.

Cuando se usa RAID 5, entra en juego un nuevo requisito, ya que la matriz debe incluir al menos tres discos. La capacidad es entonces igual a la suma total de los discos, menos el tamaño de uno de ellos. Por ejemplo, un RAID 5 con siete discos de 2 TB termina siendo 12 TB (7 x 2 es 14 y menos una unidad es 12).

Cuando uno de esos discos falla, un administrador puede cambiarlo y hacer que el sistema reconstruya el reemplazo con datos del resto de la matriz, utilizando la información de paridad mencionada anteriormente. Hay dos desventajas principales en esta configuración. Primero, hay un impacto en el rendimiento de escritura (hay una sobrecarga al escribir todos esos bits adicionales de información de paridad mientras se escriben los datos reales). En segundo lugar, durante una reconstrucción, la matriz es vulnerable a la pérdida total si una de las unidades en buen estado también falla. Dependiendo de la carga de trabajo de la máquina, una reconstrucción podría crear un pico repentino en la actividad de esas unidades y terminar haciendo que una de las unidades en buen estado también falle. Esta preocupación es la razón por la que, actualmente, muchos administradores optan por RAID 6.

RAID 6

Una evolución natural de RAID 5, RAID 6 toma el mismo concepto básico y extiende la "unidad única" de información de paridad a un par de unidades. Si bien la totalidad de las unidades individuales no se usa para la paridad, la capacidad general de las unidades se usa en toda la matriz, y RAID 6 usa el espacio de dos unidades para contener los bits de paridad.

El uso del espacio de un disco adicional significa que la cantidad mínima de discos para una matriz RAID 6 sube a cuatro. Este cambio aparentemente simple puede significar mucho bien cuando se trata de reconstruir una unidad fallida y seguir ejecutando una matriz. Puede estar seguro de que una falla adicional no significará una pérdida total de los datos que viven localmente en la máquina.

RAID anidado

Más allá de los niveles 0, 1, 5 y 6, nos encontramos con la idea de anidar niveles de RAID para crear configuraciones novedosas que ofrezcan nuevas opciones de almacenamiento. Los más frecuentes y beneficiosos son 10, 50 y 60; siendo cada uno una combinación de 1, 5 y 6 más 0, respectivamente.

RAID 10

Una combinación de 1 y 0 puede parecer que debería haber sido RAID 5 de nuevo, pero la mejor manera de pensar en estos niveles anidados es en dos dimensiones. Para RAID 10 tomamos múltiples matrices RAID 1 y seccionándolas como si esas matrices fueran discos, creando una matriz RAID 0 a partir de ellas. Debido a este factor, RAID 10 requiere al menos cuatro discos:dos para un espejo y un par de esos espejos. Lo que obtenemos es una matriz con una velocidad similar a la de RAID 0, pero que se beneficia de la redundancia interna de una RAID 1. Una matriz RAID 10 solo fallaría cuando falla una de las matrices RAID 1 internas.

En cada par de RAID 1 (o múltiples espejos si así lo elige un administrador), la recuperación es posible cuando es necesario reemplazar los discos, por lo que un conjunto completo de miembros de RAID 1 debería fallar para que el propio RAID 10 sucumba a la pérdida de datos. . Las reconstrucciones también son diferentes. En RAID 5, los datos deben leerse de todas las unidades de la matriz para calcular nuevos bits a partir de la paridad que se escribió previamente. RAID 10, dado que usa RAID 1, lee de los clones de la unidad fallida para reconstruirla.

INCURSIÓN 50

Al igual que RAID 10, RAID 50 nos brinda la opción de crear una matriz rápida a partir de matrices redundantes. Terminamos con un RAID 0 que abarca varias matrices RAID 5, similar a cómo RAID 10 era un conjunto de matrices RAID 1. Aquí es donde comenzamos a ver muchos discos entrar en escena incluso para las configuraciones más simples. Dado que un RAID 5 básico requiere tres discos, un RAID 50 requeriría al menos un total de seis, ya que es como mínimo un par de matrices RAID 5.

Nuevamente, similar a RAID 10, esta opción es lo mejor de dos mundos. RAID 50 nos brinda velocidad adicional al agregar más discos en paralelo, al mismo tiempo que nos brinda la información de paridad interna de la configuración de RAID 5. Un RAID 50 puede soportar la falla de varias unidades, siempre que no estén dentro de la misma matriz RAID 5 anidada.

RAID 60

En este punto, RAID 60 no debería sorprender, ya que es la misma extensión lógica de RAID 6 a 60 que RAID 5 a 50. El mayor beneficio adicional son las ganancias de velocidad que se pueden lograr, combinadas con el aumento masivo de la redundancia proporcionada en las múltiples copias de la información de paridad y el alcance limitado de fallas para cada arreglo anidado. Las matrices RAID 60 comienzan con ocho unidades, ya que cada RAID 6 tiene al menos cuatro, en múltiplos de al menos dos matrices.

RAID vs. copias de seguridad

Uno de los dichos más comunes en el ámbito de la administración de sistemas parece ser:"RAID no es una copia de seguridad". Para los nuevos administradores o aquellos que no dedican mucho tiempo a pensar en el almacenamiento, este hecho puede no ser obvio de inmediato. Incluso puede parecer antagónico o simplemente incorrecto.

El problema proviene del hecho de que la redundancia integrada en las configuraciones RAID se crea con los mismos objetivos en mente que las copias de seguridad:luchar contra la pérdida de datos. La razón por la que es tan importante hablar de la diferencia no es para ser quisquilloso, sino para recordarnos que estas herramientas existen para brindarnos capas de protección, y al agruparlas nos perjudicamos a nosotros mismos.

RAID existe para proporcionar una copia viva e inmediata de los datos para ayudar a una máquina en funcionamiento como una muleta a medida que se recupera después de un tropiezo. Por otro lado, las copias de seguridad ofrecen la oportunidad de probar nuestra capacidad para restaurar una máquina a un estado de funcionamiento o para recuperar datos sin necesidad de que la máquina esté funcionando. Las copias de seguridad nos brindan otros beneficios que RAID tampoco brinda, incluida la capacidad de enviar copias a múltiples lugares en múltiples tipos de medios y guardar múltiples versiones.

RAID y las copias de seguridad cumplen diferentes roles, pero ambos son importantes y no se deben descuidar.


Linux
  1. Los 5 mejores programas de copia de seguridad de datos para Linux

  2. ¿Pseudoarchivos para datos temporales?

  3. ¿Alternativa para Mendeley para Ubuntu?

  4. ¿Quién fabrica portátiles para Ubuntu?

  5. copy_to_user() y copy_from_user() para el tipo de datos básico

Trucos y tratos para administradores de sistemas y operaciones

Los 15 mejores sistemas de gestión de bases de datos para escritorio Linux

¿Qué es una base de datos distribuida y para qué sirven los sistemas de datos distribuidos?

¡Cómo instalar Anaconda en Linux para la ciencia de datos gana!

Los 20 mejores software de minería de datos para escritorio Linux

Los 15 mejores administradores de compresión o archivo para el sistema Linux