14 junio, 2008

Almacenamiento de Datos a Largo Plazo Que Permite Su Consulta Fácil

Boletín NC&T Vol. 1, No. 621 6 de Junio de 2008.

Foto: UCSCAunque la era digital lleva ya un buen camino recorrido, todavía existe un detalle crucial en el cual se debe trabajar: cómo almacenar cantidades enormes de información digital en una forma que permita que las futuras generaciones puedan acceder a ella.

"El problema es cómo construir un sistema de almacenamiento de datos a gran escala que perdure de 50 a 100 años", plantea Ethan Miller, profesor de ciencias de la computación en la Escuela de Ingeniería Baskin de la Universidad de California, Santa Cruz.

Las bibliotecas de cinta se utilizan ampliamente para almacenar datos, pero la cinta digital tiene muchos inconvenientes. El grupo de Miller ha propuesto un nuevo método, llamado Pergamum, el cual utiliza unidades de discos duros para proporcionar almacenamiento rentable y energéticamente eficiente. El abaratamiento de los discos duros los ha hecho más competitivos que las cintas, y brindan además numerosas ventajas para la búsqueda y recuperación de datos.

Pergamum es una red distribuida de dispositivos de almacenamiento inteligentes basados en discos. Dentro del equipo que lo desarrolló figuran Mark Storer y Kevin Greenan de la universidad, junto con Kaladhar Voruganti de NepApp (anteriormente Network Appliance), una compañía especializada en soluciones de almacenamiento y gestión de datos.

El almacenamiento de datos es un tema importante para las empresas, debido en parte a los requerimientos legales de preservación de registros financieros y comerciales, y también debido a que las estrategias de minería de datos pueden transformar los datos almacenados en un recurso valioso. El almacenamiento a largo plazo es además una cuestión de creciente importancia para todas las personas que están llenando sus ordenadores personales con fotos, películas, y documentos, materiales exclusivamente digitales en la mayoría de los casos.

"Existe el riesgo de que la historia cultural de una generación entera se pueda perder si las personas no son capaces de recuperar esta información", advierte Storer. "Mucha gente se está pasando a las cámaras digitales, pero nunca hemos demostrado que los datos digitales puedan ser preservados de forma fiable durante un largo tiempo".

Los investigadores diseñaron el sistema para proporcionar un almacenamiento de datos fiable y energéticamente eficiente, utilizando componentes de fácil adquisición. Éste además tiene la capacidad de evolucionar con el transcurso del tiempo, a medida que cambien las tecnologías de almacenamiento.

El almacenamiento de datos para un archivo de consulta es muy diferente a simplemente crear una copia de respaldo de los datos. Un respaldo es una copia de seguridad; usted no desea tener que usarla. En cambio, un archivo de datos para consulta sí es algo que puede utilizar con frecuencia, ya que es un recurso valioso y usted necesita ser capaz de extraer información.

Las cintas funcionan bien para los respaldos, en los que los datos se escriben una sola vez, se leen raramente, y no son mantenidos por tiempo indefinido. Pero los datos de archivos de consulta deben ser fáciles de leer, consultar, y buscar, y la cinta posee en estas áreas debilidades inherentes a su naturaleza. Los sistemas existentes basados en discos ofrecen una buena eficacia de gestión para el usuario, pero dependen de procesadores centrales que consumen mucha energía.

Pergamum utiliza componentes básicos individuales, consistentes en un disco duro; un procesador pequeño de poco consumo (como el chip de un iPhone); una tarjeta de memoria flash; y un puerto ethernet. Estas unidades, llamadas "tomos", se conectan utilizando conmutadores ethernet relativamente baratos.

Para la fiabilidad, Pergamum utiliza dos niveles de redundancia, dentro y entre los discos, para protegerse de fallos de éstos y de errores en la escritura de los datos al disco. Al sistema se le pueden añadir tomos fácilmente para expandirlo o para reemplazar discos que sufran fallos.

Y si los discos duros usados se vuelven obsoletos dentro de diez años, Pergamum no sufrirá el mismo destino. Para el funcionamiento del sistema, no importa qué clase de dispositivo sea el medio físico de almacenamiento y qué tecnología utiliza. Basta con que el dispositivo siga el protocolo simple que le permita operar como parte de la red.

No hay comentarios.: