Tags

CURACIÓN DE DATOS 

La curación de datos es el proceso continuo de gestión de los datos de investigación a lo largo de todo su ciclo de vida. Esto implica organizar, describir, depurar y conservar los datos para que sean fáciles de encontrar, accesibles, interoperables y reutilizables (FAIR). Fuente: Center for Open Science –
.

La Red de Curación de Datos (Data Curation Network, DCN), organización de miembros formada por repositorios de datos institucionales y sin ánimo de lucro de todo Estados Unidos, promueve la investigación abierta haciendo que los datos sean más éticos, reutilizables y comprensibles. Como parte de estos esfuerzos, la DCN crea y difunde buenas prácticas de curación, desarrolla recursos y formaciones centrados en la comunidad y facilita el diálogo en torno a la curación de datos. Como destacan los miembros de la DCN, la curación de datos es esencial para preservar y mejorar la investigación, además de potenciar la facilidad de búsqueda, la reutilización, el impacto y la integridad.

¿Por qué curar datos?

Como explicó Wanda Marsolek, bibliotecaria de curación de datos de la Universidad de Minnesota, los datos brutos pueden ser desordenados y carecer de contexto. Sin una curación adecuada, los datos pueden resultar fragmentados, incoherentes y difíciles de interpretar.

A modo de ejemplo, Marsolek compartió un conjunto de datos que no contenía etiquetas de variables que indicaran lo que representa cada columna. «Si descubriéramos estos datos, no podríamos reutilizarlos», afirmó. «No tendríamos ni idea de qué son estas filas o columnas: unidades de medida o algo por el estilo».

¿Quiénes participan en la curación de datos?

La curación de datos es una colaboración entre investigadores, sistemas de repositorios y profesionales y curadores de datos. Durante el proceso de curación, los datos se organizan, describen, limpian, mejoran y conservan de forma sistemática para su uso público, de manera similar a como un conservador de museo prepara las obras de arte para su exposición.

«Los conservadores de datos están en una posición idónea para ofrecer opiniones sobre qué se debe compartir abiertamente, dónde se deben compartir los resultados y qué restricciones de acceso, si las hay, podrían ser necesarias para los datos», afirmó Marsolek. «La función del conservador de datos es apoyar a los investigadores en esta labor proporcionando diferentes niveles de apoyo a la conservación».

Niveles de conservación de datos

Los conjuntos de datos pueden revisarse con diferentes grados de profundidad, lo que a su vez repercute en la facilidad de búsqueda, el acceso y la equidad. Las decisiones sobre qué nivel utilizar pueden basarse en limitaciones de tiempo y capacidad, restricciones de conocimiento, las necesidades de los datos y la colaboración entre los participantes.