Tal vez estas sean líneas un poco densas, pero son conceptos básicos del funcionamiento de las tripas del almacenamiento en los servidores. Cuando se comprenden cosas como volúmenes, RAID, funciones avanzadas del sistemas de archivos, etcétera; comprenderemos gran parte del funcionamiento de nuestro NAS.
Lo que sigue es un resumen de algunas de las cosas más elementales con las que me topé al momento de montar mi NAS con discos en RAID.
RAID: Qué es y para qué nos sirve
El concepto de RAID se basa en la combinación de múltiples unidades de disco, pequeñas y poco costosas, que se agrupan para lograr mejor rendimiento o redundancia, algo que no se puede lograr con una única unidad, grande y costosa.
El sistema operativo considerará esta agrupación de discos como si fuera una sola unidad.
El uso de un Raid tiene varias ventajas:
- Mayor velocidad de lectura
- Mayor capacidad de almacenamiento usando un solo disco virtual.
- Disminución del impacto del fallo de un disco.
Un RAID está basado en el principio de que los datos tienen que distribuirse en cada conjunto de discos, de manera consistente. Para ello, los datos se rompen en trozos o grupos de datos con un tamaño que varía, normalmente entre 32K y 64K, aunque se pueden usar otros tamaños. Cada grupo de datos se escribe en el disco rígido de diferente manera según el tipo o nivel de RAID, como veremos más adelante.
Existen dos posibilidades de usar un RAID: por hardware o por software. Me centraré en este último, ya que es el más económico y es lo que se utiliza en casi todos los servidores NAS que podemos encontrar.
RAID por software: ¿Por qué?
El RAID por software implementa los diversos niveles o tipos de RAID en el kernel (dispositivo de bloque). Es barato, mientras que las tarjetas controladoras de disco o los chasis «hot-swap» son bastante caros. El software RAID funciona tanto con discos IDE como con discos SCSI. Además, con los procesadores actuales, el rendimiento del software RAID es muy alto.
Por otra parte, los RAID que hacen uso de complejos cálculos de paridad, como el 5 o 6, son todo un desafío para los sistemas de archivos modernos. Recordarán en el articulo anterior la dificultad que tiene BTRFS para lograr un RAID 5 y 6 estable, por ejemplo.
¡RAIDs! (Solo los más comunes)
Estos son los tipos más comunes que encontraremos o aquellos por los que podremos decantarnos a la hora de configurar nuestro servidor:
- RAID 0 o striping
- RAID 1 o réplica o mirroring
- RAID 5 o striping con paridad
- RAID 6 o striping con doble paridad
- RAID 10 o Combinación de réplica y striping
RAID 0
También llamado «striping,». Los datos que se escriben en la unidad de disco se dividen en bloques y se escriben en los discos que forman parte del conjunto. Esto permite un rendimiento alto de Entrada/salida, pero no proporciona redundancia.
Esto se debe a que los datos se leen y escriben en ambos discos en paralelo ampliando así la velocidad. La capacidad de almacenamiento es igual a la suma de los discos pertenecientes al RAID.
Es fácil de implementar y no requiere trabajo de procesamiento para el control de paridad, ya que esta no existe.
La posibilidad de tener mayor capacidad y mejor rendimiento en lectura y escritura suena interesante, pero cuidado que, si se arruina un disco, perdemos todo. Así que no parece tan interesante, viendo las posibilidades de desastre…
RAID 1
Espejos o réplicas: ha sido durante mucho tiempo el tipo más usado de RAID. Proporciona redundancia al escribir datos idénticos en cada uno de los discos miembros, dejando una copia en cada disco.
Esta técnica es muy popular debido a su simplicidad y la alta velocidad de transferencia de lectura de datos. Ofrece una gran fiabilidad y mejora el rendimiento de las aplicaciones de lectura intensa, solo que a un precio bastante alto, ya que se escribe la misma información en todos los discos del RAID. Es decir, que la capacidad de almacenamiento es igual a la capacidad de cada disco.
Cuando un disco falla, no es necesario calcular la paridad y reconstruir el contenido, sino que el contenido simplemente se replica en el disco nuevo, esto lo hace simple y rápido.
RAID 5
Este es un tipo de RAID muy común actualmente. Lo que hace es distribuir los datos de paridad entre los discos miembros del RAID. Dicho esto, se requieren al menos 3 discos para implementarlo.
Si los datos de un determinado bloque ya no están disponibles, la computadora puede volver a calcular el contenido usando los datos de paridad. Eso significa que un grupo de discos en RAID 5 puede soportar una falla de unidad única sin perder datos o acceso a datos.
En resumen, la velocidad de lectura es muy rápida, mientras que las velocidad de escritura es algo más lenta debido a la paridad que debe calcularse.
Esta es una tecnología más compleja que un RAID 1. Si uno de los discos falla y se reemplaza, la restauración de los datos puede tomar un día o más, por el tiempo que lleva el cálculo para la reconstrucción.
Y cuidado, que si por casualidad otro disco se estropea durante ese momento de reconstrucción, los datos se pierden para siempre.
En resumen, el RAID 5 es un buen sistema que combina almacenamiento eficiente, excelente seguridad y rendimiento muy decente.
RAID 6
Este es similar al RAID 5, pero los datos de paridad se escriben en dos unidades. Eso significa que se requieren al menos 4 unidades para implementarlo, y puede soportar que 2 unidades fallen simultáneamente.
Las posibilidades de que dos unidades fallen, en el mismo momento, son muy bajas. Pero para aquellos precavidos que no confían en la suerte, que no quieran pasar ningún estrés o arriesgar su salud mental, durante el proceso de reconstrucción en un sistema con RAID 5… bueno, para ellos se inventó el RAID 6.
En este caso el volumen incluso sobrevivirá a esa segunda falla. Pero el proceso de escritura puede verse penalizado ya que exige cálculos adicionales de paridad.
RAID anidados
Se indican normalmente uniendo en un solo número los correspondientes a los niveles RAID usados. A veces se agrega un signo «+» entre ellos.
Por ejemplo, el RAID 10 o RAID 1+0 consiste en múltiples conjuntos de nivel 1 almacenados en discos físicos con un nivel 0.
Y así es posible combinar las ventajas y desventajas de los RAID 0 y 1 en un solo sistema. Esta es una configuración RAID anidada o híbrida.
Proporciona seguridad mediante la duplicación de todos los datos en las unidades secundarias al tiempo que utiliza «striping» en cada conjunto de unidades para acelerar las transferencias de datos.
¿Y qué pasa con los RAID 2, 3, 4 y 7?
Bueno, estos tipos existen, claro. Pero no son tan comunes. Por ejemplo, el RAID 3 es esencialmente como RAID 5 pero con los datos de paridad escritos siempre en la misma unidad. Y los otros tipos son variantes menos utilizadas o que no aportan una ventaja clara sobre los ya mencionados. Así que no los mencionaré, por el momento.
¡RAID no es un sustituto de la copia de seguridad!
Si te interesa crear un RAID pero primero quieres chequear el espacio que tendrás disponible o las velocidades de lectura y escritura teóricas, puedes consultar aquí. Esta es una pequeña calculadora de RAIDs donde poniendo la configuración que deseas crear, te arroja los resultados que obtendrías en tu servidor.
Todos los niveles de RAID excepto RAID 0 ofrecen protección contra fallas de un solo disco. Un sistema RAID 6 incluso sobrevive a 2 discos que fallen simultáneamente. No obstante es importante tener una copia de seguridad de nuestros datos.
Esta copia de seguridad será útil si todas las unidades fallan simultáneamente debido por ejemplo, a un pico de energía, a un robo del sistema de almacenamiento, ante un desastre natural o si un incendio destruye el lugar donde se encuentra el NAS.
Una razón tan importante como las anteriores para realizar copias de seguridad es que ningún RAID es a prueba de usuarios distraídos. Y si se borran accidentalmente algunos datos importantes y esto pasa desapercibido un tiempo, solo una buena copia de seguridad posibilita que se puedan recuperar esos archivos.
Espero que les haya resultado interesante. En próximos artículos iré comentando algunas otras tecnologías que mueven nuestros servidores. Espero sus comentarios, que vienen siendo muy buenos.
¡Un saludo y hasta el próximo articulo!
Bibliografia
hipertextual.com – Que es un raid de discos-duros
redeszone.net – raid calculator nas
La imagen destacada se distribuye bajo licencia CC0.
Las imágenes del articulo se distribuyen bajo licencia CC0.
No necesita RAID cuando puede soportar varias horas de inactividad y soportar la pérdida de datos mientras su sitio se recupera de la copia de seguridad de datos.
RAID es beneficioso cuando el tiempo de actividad y la confiabilidad son las métricas esenciales de su negocio. Las copias de seguridad son necesarias porque ayudan en caso de pérdida grave de datos. Pero en cualquier falla del disco, restaurar una gran cantidad de datos incluso lleva varias horas o días. RAID lo protege de la pérdida de datos sin tiempo de inactividad en caso de falla de uno o más discos.
Hay diferentes calculadoras RAID en Internet. También debe marcar el proporcionado por DNSCHECKER.
https://dnschecker.org/raid-calculator.php