Resumen
Introducción: La preservación digital es la base de la permanencia de enlaces y citas académicos, y utiliza el sistema de identificación de objetos digitales (DOI). En este momento, desconocemos hasta qué punto se están conservando los artículos a los que se les ha asignado un DOI.
Métodos: A partir de archivos originales construimos una base de datos de información preservada, tras lo cual examinamos los estados de preservación de 7.438.037 DOI en una muestra aleatoria.
Resultados: De los 7.438.037 trabajos examinados, encontramos 5,9 millones de copias distribuidas entre los archivos que usamos en este estudio. Además, un total de 4.342.368 de los trabajos que estudiamos (58,38%) figuraban en al menos un archivo. Sin embargo, esto dejó 2.056.492 trabajos en nuestra muestra (27,64%) que al parecer no se han preservado. El restante 13,98% de los trabajos en la muestra se excluyeron porque eran muy recientes (se habían publicado ese mismo año), no eran artículos de publicaciones o no tenían suficientes fechas de metadatos para identificar la fuente.
Discusión: El diseño limita nuestro estudio de varias maneras. Entre estas está el hecho de que utilizó solo un subconjunto de archivos, solo rastreamos artículos con DOI y no incluimos los repositorios institucionales. No obstante, al ser un primer intento de evaluar la situación, nuestros resultados serán de interés para bibliotecas, casas editoriales e investigadores.
Conclusión: Este trabajo revela un déficit alarmante en la preservación de información. Solo se puede confirmar que el 0,96% de los miembros de Crossref (n=204) conservan digitalmente más del 75% de su contenido en tres o más de los archivos que estudiamos. (Nótese que cuando nos referimos a “preservado” en este artículo, queremos decir “que podemos confirmar que están preservados”, como especificamos en las limitaciones de este estudio). Una proporción menor, es decir, el 8,5% (n=1.797) conservó más del 50% de su contenido en dos o más archivos. Sin embargo, muchos miembros, es decir, 57,7% (n=12.257) solo alcanzaron el umbral con el 25% de su material en un único archivo. Lo más preocupante es que el 32,9% (n=6.982) de los miembros de Crossref parecen no tener un sistema de preservación digital apropiado, lo que va en contra de las recomendaciones de la Coalición para la Preservación Digital.