Tags

Qué son los Datos de investigación

Los datos de investigación son aquellos datos que son recolectados, observados o creados para ser analizados y producir resultados de investigación originales. [Fuente: Cepal]

La Comisión Europea define los datos de investigación, a la información, en particular factual o numérica recogida para ser examinada y considerada como la base de un razonamiento, de una discusión o de un cálculo.

En un contexto de investigación, los ejemplos de datos incluyen estadísticas, resultados de experimentos, mediciones, observaciones resultantes del trabajo de campo, resultados de encuestas, grabaciones de entrevistas e imágenes. La atención se centra en los datos de investigación que están disponibles en forma digital. Los usuarios normalmente pueden acceder, extraer, explotar, reproducir y difundir datos de investigación de libre acceso de forma gratuita.

Tipología de los datos de Investigación, está en función de:

Nivel de procesamiento en el curso de la investigación:

  • Datos primarios o sin procesar: Datos originales que han sido recolectados pero aún no han sido procesados o analizados. Algunos ejemplos son los registros sonoros, observaciones, notas de campo o datos de experimentos.
  • Datos procesados: Datos que han sido digitalizados, traducidos, transcritos, limpiados, validados, verificados y/o anonimizados.
  • Datos analizados: Modelos, gráficos, tablas, textos u otros, que han sido creados a partir de los datos primarios y procesados, y que se pretende sean de ayuda en el descubrimiento de información útil, la presentación de conclusiones y la toma de decisiones.

Según la fuente de la que provienen:

  • Datos canónicos o de referencia: Sets de datos que pueden ser utilizados para validación, comparación o búsqueda de información (por ejemplo, secuencias del genoma humano, estructuras químicas o portales de datos espaciales)
  • Datos experimentales: Datos generados en experimentos científicos. Generalmente son reproducibles y pueden ser generados por equipos de laboratorio.  
  • Modelos o simulaciones: Datos generados en computadores por algoritmos, modelos matemáticos, o simulaciones de experimentos.
  • Datos derivados: Sets de datos creados al tomar datos ya existentes y realizar algún tipo de manipulación sobre los mismos.
  • Observaciones: Datos generados al registrar observaciones de un evento específico y posiblemente irrepetible, en un lugar y tiempo dados.

Según su forma o tipo:

Documentos de texto electrónicos, Planillas de datos, Cuadernos de campo o anotaciones de laboratorio, Cuestionarios o transcripciones, otografías o películas, Registros sonoros, Muestras, artefactos,Objetos digitales, Modelos, algoritmos, scripts, Bases de datos, Metadatos, Esquemas de metadatos, Configuraciones de software, Archivos de pre o post procesamiento de software…

Según su formato:

  • Textuales (Microsoft Wod, PDF, RTF, ODT, etc.)
  • Numéricos (Excel, CSV, etc.)
  • Multimedia (JPEG, MPEG, WAV, etc.)
  • Estructurados (XML, base de datos MySQL, etc.)
  • Código de software (Java, C, etc.)
  • Específicos de un software (Mesh, 3D CAD, modelo estadístico, etc.)
  • Específicos de una disciplina (FITS en astronomía, CIF en química, etc.)
  • Específicos de un instrumento (Olympus Confocal Microscope Data Format, Carl Zeiss Digital Microscopic Image Format)

Un mayor acceso a las publicaciones científicas y los datos ayuda a:

  • Construir sobre los resultados de investigaciones anteriores (mejora de la calidad de los resultados)
  • Fomentar la colaboración y evitar la duplicación de esfuerzos (mayor eficiencia)
  • Acelerar la innovación (un avance más rápido hacia el mercado significa un crecimiento más rápido)
  • Involucrar a los ciudadanos y la sociedad (transparencia mejorada del proceso científico).