Skip to Main Content

Preservación Digital: Ingesta y almacenamiento

Esta guía es una introducción a conceptos fundamentales de preservación digital.

Ingesta

La ingesta se refiere al proceso de depositar materiales en un repositorio para su almacenamiento. Idealmente, debe haber procedimientos establecidos para la ingesta. Esto ayudará a mantener el proceso organizado y será más fácil darle seguimiento al material que se agrega al repositorio. A continuación, se presentan algunos puntos a tener en cuenta al diseñar procedimientos de ingesta.

Hable con los proveedores del contenido

Es importante establecer buena comunicación entre los administradores de un repositorio y las personas que someten materiales a la colección. Esto ayudará a que el proceso de ingesta sea más fluido y transparente. Los administradores del repositorio deben comunicarse con los proveedores de contenido. Deben familiarizarse con el tipo de contenido que se estará sometiendo y las expectativas de los proveedores con respecto a asuntos como la preservación y diseminación de los objetos digitales. La buena comunicación permite que los administradores del repositorio brinden orientación adecuada a los proveedores sobre cómo preparar los materiales para su depósito. A fin de cuentas, los proveedores obtienen una mejor comprensión de cómo funciona el modelo de administración del repositorio, y los administradores del repositorio obtienen información que les permite administrar mejor el material y servir a su comunidad de personas usuarias.

Establezca parámetros para el proceso de ingesta

Estos son algunos puntos que querrá cubrir en sus parámetros:

Metadatos descriptivos - Ayuda mucho que los proveedores del contenido asignen metadatos descriptivos al material que someten para depósito en el repositorio. Esto facilita el acceso una vez los objetos digitales se encuentran en el repositorio. Una buena práctica es hacer que los proveedores completen un formulario de metadatos cuando sometan contenido. Los administradores del repositorio deben brindar orientación a los proveedores sobre cómo llenar correctamente los diferentes campos de metadatos. Esto se puede lograr mediante la creación de un manual de metadatos. Los administradores deben recopilar suficientes metadatos al momento del depósito para la creación de registros descriptivos detallados de los materiales.

Formatos digitales - También es útil establecer parámetros con respecto a los formatos digitales. Se recomiendan los formatos de uso generalizado y no patentados para fines de preservación digital. Oriente a los proveedores de contenido para que estos sometan el material digital en formatos que faciliten el trabajo de preservación. Puede obtener más información sobre este tema proporcionada por el Archivo de la Institución Smithsonian (Smithsonian Institution Archives) pulsando aquí.

Nombres de archivos - Establecer reglas de nombrado (naming conventions) para los nombres de archivo en su colección puede ayudar al proporcionar consistencia y claridad. Los nombres de archivo deben brindar información general sobre el contenido del mismo, y al mismo tiempo deben ser relativamente cortos. Por ejemplo, un formato de nombres para tesis depositadas en un repositorio digital podría incluir las iniciales del departamento del estudiante, los apellidos e iniciales del estudiante y el año en que se aprobó la tesis. Dos tesis que sigan este formato de nombrado podrían verse así:

  • BIOL_GarciaColonP_2021
  • HIST_MendezJC_2019   

Como puede ver, estos documentos siguen un patrón de nombrado coherente que proporciona información general sobre el archivo. El formato consistente facilita la identificación de archivos específicos incluidos en la colección.

Para obtener más información sobre reglas de nombrado para archivos, vea este video de University of Wisconsin Data Services.

Genere una suma de verificación (checksums) para los materiales depositados

Es buena práctica generar una suma de verificación (checksum) para cada archivo digital en el momento de la ingesta. Esto ayuda a monitorear la fijeza, ya que la suma de verificación se puede usar más tarde para verificar si el archivo ha sido alterado de alguna manera. Muchos repositorios generan sumas de verificación automáticamente para cada archivo al momento del depósito.

Documente y evalúe el proceso de ingesta

Es importante mantener un registro de los documentos sometidos y depositados al repositorio, y crear inventarios que detallen el contenido de sus colecciones. Como muchos otros repositorios digitales, Scholar@UPRM documenta el momento del depósito de cada objeto digital.

Como debe hacerse con cualquier otro proceso, tómese el tiempo para evaluar sus procedimientos de ingesta y considere cómo se pueden mejorar. Por ejemplo, ¿está recopilando metadatos suficientes durante el proceso de ingesta? ¿Se está manteniendo un récord adecuado del proceso? ¿Los proveedores de contenido entienden bien el proceso de depósito? ¿Lo encuentran demasiado complicado o tedioso? ¿Están sometiendo el material en los  formatos digitales correctos?

Comuníquese con los proveedores de contenido y recopile sus impresiones acerca del proceso de ingesta con el fin de mejorar el mismo.

Almacenamiento

Estos son algunos puntos clave que debe considerar respecto al almacenamiento de material digital para preservación a largo plazo.

Estabilidad y redundancia

Una infraestructura de almacenamiento estable es esencial para la preservación de los materiales digitales. Otro factor clave es la redundancia, ya que múltiples copias del material proporcionan un seguro contra pérdidas irrecuperables. Un concepto que se menciona con frecuencia con relación a la redundancia es lo que se conoce como la Regla 3-2-1, la cual se puede explicar brevemente de la siguiente manera:

  • Tener al menos tres copias completas del contenido digital. La idea es tener una protección robusta contra la pérdida de información sin tener un número inmanejable de copias.
  • Utilizar al menos dos tipos diferentes de medios de almacenamiento para sus copias. Cada medio de almacenamiento tiene sus puntos fuertes y débiles. Mediante el uso de diferentes medios, puede compensar por las debilidades de cada uno.
  • Mantener una copia de su contenido en una ubicación remota. Esto ofrece protección contra eventos como un incendio o un desastre natural.

Creación de copias de resguardo ("back-ups")

La creación periódica de copias de resguardo del contenido de un repositorio es una de las acciones de preservación digital más fundamentales. Idealmente, los resguardos se generan con frecuencia utilizando un procedimiento automatizado.

Registros de metadatos

Todos los objetos almacenados en un repositorio deben ir acompañados de su registro de metadatos. Además de agregar contexto al objeto digital al proporcionar información descriptiva, el registro de metadatos brinda información adicional que puede ser crucial para su preservación. Esto puede incluir metadatos de procedencia, información sobre la relación del objeto con otros objetos, información de fijeza y especificaciones técnicas relacionadas al formato digital del objeto o programados necesarios para desplegar el mismo. 

Identificadores únicos

Asignar un identificador único a cada objeto digital contenido en el repositorio es una forma de distinguir un objeto particular de todos los demás. Scholar@UPRM asigna automáticamente un “handle”, que es un tipo de identificador único, a cada objeto depositado. Los nombres de archivo (idealmente asignados siguiendo reglas de nombrado) y los números de registro también pueden funcionar como identificadores únicos en un repositorio.

Comprobaciones de fijeza

En un escenario ideal, la fijeza de los objetos digitales almacenados se verifica periódicamente mediante un procedimiento automatizado. Esto se hace para detectar si se ha alterado la integridad a nivel de bit (“bit-level integrity”) de cualquier objeto. Si se detectan alteraciones, estas se pueden corregir lo antes posible. Realizar comprobaciones periódicas de fijeza aumenta la fiabilidad de un repositorio, ya que existe una garantía más sólida de la integridad de su contenido. Las comprobaciones de fijeza son especialmente importantes cuando el material digital se transfiere de un lugar de almacenamiento a otro o de un formato a otro.

Copias de preservación

Algunos objetos digitales pueden ser de gran tamaño, lo que dificulta que los usuarios los puedan ver o descargar. Para atender este problema, los repositorios pueden crear copias de preservación y copias de acceso de sus objetos. Las copias de preservación son las versiones originales de alta resolución y sin comprimir de los objetos digitales. Como su nombre indica, estos se mantienen guardados con fines de preservación. Las copias de acceso, que pueden ser versiones comprimidas con resolución más baja, son las que se ponen a disposición de las personas usuarias. Por ende, la creación de copias de preservación y copias de acceso es una forma de viabilizar el uso de las colecciones al mismo tiempo que se protege la integridad a nivel de bit de los objetos digitales que el repositorio está preservando.

Mantenga un control de quién tiene acceso al material almacenado

Parte de proteger sus objetos digitales es controlar quiénes tienen acceso a ellos. Determine quiénes deben tener acceso y qué roles y privilegios debe tener cada persona. Implemente contraseñas y medidas de seguridad adecuadas. Adicional a esto, mantenga un registro de acciones relacionadas al entorno de almacenamiento, tales como instancias de ingesta de objetos digitales, la transferencia de un objeto de una colección a otra, la eliminación de objetos, etc. Este registro debe indicar quién llevo a cabo cada acción.