Cómo identificar los problemas de desempeño del almacenamiento de disco

Cómo identificar los problemas de desempeño del almacenamiento de disc

Desde el momento en que se abandonó el procesamiento de archivos de forma manual o semi-manual, el diseño de estructuras de almacenamientos de datos ha sido una etapa crítica en el requerimiento final. Este no es más que mantener funcionando de forma activa, óptima y escalable las bases de datos de los clientes, de tal manera que cualquier tipo de fallo tienda a cero y, si es posible, predecir los mismos.

En la práctica, la situación en los desarrollos de almacenamiento de datos se divide entre el hardware disponible en forma de arreglo de discos y su conectividad, y el software que administra dicho hardware, como por ejemplo un monitor de intercambio de datos.

Características de rendimiento a nivel de Hardware

De acuerdo al MIT, una etapa crucial para la evaluación, administración de datos y gestión de fallos es “el tiempo que toma una unidad de disco en responder a una petición completa de E/S”, esto viene dado por lo siguiente:

Las limitaciones electromecánicas de cada disco:

En este apartado es importante acotar que el rendimiento general del disco viene dado por la suma de performance de cada componente del dispositivo físico, ahora bien, la velocidad de las partes electrónicas siempre será superior que las mecánicas por lo que estas últimas definirán el rendimiento final del disco.

Dentro de estas limitantes también se encuentran el tiempo de recorrido entre la interfaz del disco, el tiempo en que las cabezas de lecto/escritura recorren las zonas del plato, la latencia rotacional y el movimiento del brazo de acceso; sumando todo esto ya estamos alrededor de los 10 milisegundos, entre discos estándares o básicos de 5400rpm y los de alto rendimiento de 10000 rpm.

La carga de Entrada y Salida (i/o) apuntalada por el sistema:

El conjunto del rendimiento del disco y la capacidad de la puerta de entrada y salida (i/o) de almacenamiento, plasma pragmáticamente el rendimiento general del dispositivo y, por consiguiente, afecta el trabajo de los usuarios.

Esta situación hace necesario tener herramientas para diagnosticar problemas y/o de prever con anticipación los mismos de manera permanente, basados en la colecta de datos críticos en tiempo real de tal manera que se pueda evitar la degradación la aplicación.

Elección de tipo de almacenamiento y rendimiento.

Elegir el tipo de almacenamiento que nuestro sistema utilizará es otro punto crucial en el rendimiento general del sistema. Una mala selección puede trastocar cualquier sistema que pretenda escalar y a la larga el mantenimiento preventivo y correctivo de hardware y software será un gran dolor de cabeza.

En la actualidad los arreglos RAID,  (siglas en inglés de Redundant Array of Independent Disks) son los más utilizados para los sistema de mediana magnitud en adelante. Incluso se utilizan en los complejos sistemas anidados con alta redundancia y protección a fallos asegurada.

Las matrices RAID, de las que existen unas 20 en la actualidad, permiten resguardar los datos plasmando en la realidad la teoría de normalización de los mismos y la tolerancia a fallos se reduce al mínimo pero a la vez se magnifica la lecto/escritura de los datos.

Desde el RAID O hasta el RADI 5+0 o RAID 50, se va desde el solo aceleramiento de la lecto/escritura hasta todas las características acumuladas y la seguridad de la máxima tolerancia a fallos.

Es importante decir aquí, que los RAID son arreglos en matrices que protegen el sistema de almacenamiento de datos a nivel de hardware solamente, no representan un respaldo sino la redundancia necesaria para acceder a los datos, esto último debe asegurarse mediantes software específico que permita gestionar estas situaciones.

Evaluando los tipos de sistema de archivos, Fragmentado vs No-Fragmentado:

Desde sus inicios, los sistemas de archivos han desperdiciado espacio al momento de grabar, leer y volver a grabar un archivo o partes de archivos en sectores que al no poder ser ocupados completamente, son marcados como usados pero en realidad por el tipo de división que usa el sistema no pueden usarse ni solaparse con otro archivo porque corrompería los datos.

Este es la idea básica sobre el fragmentamiento de archivos, que en los dispositivos de disco en plato magnético se da a diario que afecta el rendimiento del almacenamiento, y que aun cuando el en algunos casos el software se encarga de desfragmentar automáticamente al estar activa esta opción el algoritmo no mucha veces es lo suficientemente inteligente para hacerse a un lado cuando se requiera y no estorbe en el flujo de datos.

Esta situación no se ve en los discos de estado sólido o SSD, es decir no requieren defragmentar los datos, en ellos ocurre otra situación que debemos tener en cuenta y es que las cómo sabemos las escrituras sucesivas y extensivas en un SSD degradan el disco, por lo que las página (sectores) parcialmente llenos también se encuentran presentes y se debe utilizar otra estrategia para recuperar dicho espacio valioso.

Ejemplos de aplicaciones RAID para optimizar el rendimiento de los datos.

Un ejemplo en la vida real de un sistema que permita almacenar datos y optimizar su entrada y salida para una mejor lectura/escritura es un Arreglo de Discos para MS Exchange Server, un servidor de correos empresarial muy utilizado en la actualidad.

De acuerdo a la cantidad de discos disponibles y empezando con 2 y 4 discos, tenemos para ellos RAID 1 con dos particiones, una para el sistema operativo y paginación y la otra para Exchange Server.

Si disponemos de 5 discos, la disposición podría ser de 3 discos para los archivos y la base de datos, mientras que podemos obtener un RAID para los logs del sistema.

Si escalamos a seis discos entonces podemos usar 5+1 y un NO RAID, en un arreglo de Archivos, logs y paginación respectivamente.

Estas son solo algunas situaciones y características que podemos mencionar respecto a la optimización, resguardo de datos y perfeccionamiento del almacenamiento, existen otras situaciones que mencionaré posteriormente.

Ing. Roberto Alemán

Tipos de Conexiones para discos duros

En este artículo vamos a identificar las diferentes conexiones existentes para discos duros, todos sabemos que es un disco duro y lo utilizamos a diario sea de platos giratorio o de estado sólido.

Zif IDE / CF de 40 pines 1.8″ pulgadas

1 8 zif ide cf 40 pin

Laptop IDE pata 40 pines 2.5 pulgadas

2 5 laptop ide pata 44 pin

3 5 desktop ide pata 40 pin

Laptop destop SATA 7 pines

laptop desktop sata 7 pin

SCSI DB 68 pines

scsi db 68 pin

SCSI IDC 50 pines

scsi idc 50 pin

SCSI SAS 7 pines data

scsi sas 7 pin data

SCSI SCA 80 pines

scsi sca 80 pin

 

IDE/CF50 pines 1.8″ pulgadas

1 8 idea cf 50pin

 

Tipos de conexión de datos

Las unidades de discos duros pueden tener distintos tipos de conexión o interfaces de datos con la placa base. Cada unidad de disco rígido puede tener una de las siguientes opciones:

Cuando se conecta indirectamente con la placa base (por ejemplo: a través del puerto USB) se denomina disco duro portátil o externo.

IDE, ATA o PATA

La interfaz ATA (Advanced Technology Attachment) o PATA (Parallel ATA), originalmente conocido como IDE (Integrated Device Electronics o Integrated Drive Electronics), controla los dispositivos de almacenamiento masivo de datos, como los discos duros y ATAPI (Advanced Technology Attachment Packet Interface) o unidades de discos ópticos como lectoras o grabadoras de CD o DVD.

Hasta el 2004, aproximadamente, fue el estándar principal por su versatilidad y asequibilidad.

Son planos, anchos y alargados.

SATA

Serial ATA o SATA es el más novedoso de los estándares de conexión, utiliza un bus serie para la transmisión de datos.

Notablemente más rápido y eficiente que IDE.

Físicamente es mucho más pequeño y cómodo que los IDE, además de permitir conexión en caliente (hot plug).

Existen tres versiones:

  1. SATA 1 con velocidad de transferencia de hasta 150 MB/s (descatalogado),
  2. SATA 2 de hasta 300 MB/s, el más extendido en la actualidad;
  3. SATA 3 de hasta 600 MB/s el cual se está empezando a hacer hueco en el mercado.

SCSI

Las interfaces Small Computer System Interface (SCSI) son interfaces preparadas para discos duros de gran capacidad de almacenamiento y velocidad de rotación.

Se presentan bajo tres especificaciones:

  1. SCSI Estándar (Standard SCSI),
  2. SCSI Rápido (Fast SCSI) y
  3. SCSI Ancho-Rápido (Fast-Wide SCSI).

Su tiempo medio de acceso puede llegar a 7 milisegundos y su velocidad de transmisión secuencial de información puede alcanzar teóricamente los 5 Mbit/s en los discos SCSI Estándares, los 10 Mbit/s en los discos SCSI Rápidos y los 20 Mbit/s en los discos SCSI Anchos-Rápidos (SCSI-2).

Un controlador SCSI puede manejar hasta 7 discos duros SCSI (o 7 periféricos SCSI) con conexión tipo margarita (daisy chain). A diferencia de los discos IDE, pueden trabajar asincrónicamente con relación al microprocesador, lo que posibilita una mayor velocidad de transferencia.

SAS

Serial Attached SCSI (SAS) es la interfaz de transferencia de datos en serie, sucesor del SCSI paralelo, aunque sigue utilizando comandos SCSI para interaccionar con los dispositivos SAS. Aumenta la velocidad y permite la conexión y desconexión en caliente. Una de las principales características es que aumenta la velocidad de transferencia al aumentar el número de dispositivos conectados, es decir, puede gestionar una tasa de transferencia constante para cada dispositivo conectado, además de terminar con la limitación de 16 dispositivos existente en SCSI, es por ello que se vaticina que la tecnología SAS irá reemplazando a su predecesora SCSI.

Además, el conector es el mismo que en la interfaz SATA y permite utilizar estos discos duros, para aplicaciones con menos necesidad de velocidad, ahorrando costes. Por lo tanto, las unidades SATA pueden ser utilizadas por controladoras SAS pero no a la inversa, una controladora SATA no reconoce discos SAS.

 

Seagate lanza los primeros discos duros de 8 Terabytes

SATA_Hard_Drive

Curiosamente, para presentar un disco duro, el vicepresidente de marketing de Seagate, Scott Horn, ha hablado de la “movilización” del mundo. De cómo ha aumentado el número de dispositivos que usan los consumidores. Así que el desafío, como parece fácil de presuponer, va más hacia qué ofrecer a centros de datos y empresas. En cualquier caso, no ha dado más detalles sobre velocidad de lectura o de escritura, sólo ha anunciado que ya se están enviando algunas unidades de prueba, y que el mercado acogerá estos discos duros de 8 TB a partir del próximo trimestre, a finales de año presumiblemente.

Tampoco se han anunciado los precios, pero ser “el primero del mundo” en un producto que es costoso a partir de ciertos niveles de almacenamiento, no presagia nada barato.

Western Digital lanza un disco duro de 6 terabytes

El Ultrastar He6 almacena 6 TB de información, en comparación a los 4TB que logra actualmente la industria.

La subsidiaria HGST de Western Digital anunció el Ultrastar He6, un nuevo disco duro de 3,5 pulgadas que logra almacenar hasta 6TB de espacio, en comparación a los 4TB que se lograban hasta ahora como máximo. Además, el disco usa 23% menos energía y es 38% más liviano. ¿El secreto? Helio.

La compañía explica que el aire limita el número de discos que pueden ser colocados dentro de una unidad de almacenamiento, provocando que el estándar sean hasta cinco discos en un espacio de 1 pulgada. Pero al reemplazar el aire con helio, esa resistencia se reduce, permitiendo poner más discos en menos espacio. Así, en lugar de 5, HGST hizo caber 7 en el mismo espacio.

Con menor resistencia del aire también se reduce el consumo de energía, y funcionan un poco más silenciosamente. El disco está pensado para el mundo empresarial, donde es necesario almacenar petabytes de información con gabinetes llenos de discos duros y con consumos energéticos masivos.

Link: Computerworld

Intel lanza al mercado nuevos discos duros SSD NAND de 25 nanómetros

Intel ha dicho que los discos 520 Series no sólo mejoran en fiabilidad y seguridad, sino que además son más rápidos que los productos anteriores.

La nueva familia de SSD está basadas en chips de almacenamiento NAND de 25 nanómetros y utilizan el interface SATA III para alcanzar velocidades de lectura de más de 550Mbps y 520Mbps de velocidad de escritura. Las unidades utilizan el procesador de almacenamiento flash LSI SandForce para acelerar el rendimiento.

Además, Intel está mejorando las protecciones de seguridad de las unidades incorporando cifrado AES de 256-bit y un sistema de protección de contraseña más fuerte.

Creado como un producto de alta gama, la compañía dice que el producto está pensado para el mercado de juegos así como para cuando se demande un gran rendimiento.

Los nuevos discos SSD de Intel están disponibles para los OEMs a precios de 149 dólares el modelo de 60GB y de 999 dólares el de 480GB.