Tags
Qué son los Datos de investigación
Los datos de investigación son aquellos datos que son recolectados, observados o creados para ser analizados y producir resultados de investigación originales. [Fuente: Cepal]
La Comisión Europea define los datos de investigación, a la información, en particular factual o numérica recogida para ser examinada y considerada como la base de un razonamiento, de una discusión o de un cálculo.
En un contexto de investigación, los ejemplos de datos incluyen estadísticas, resultados de experimentos, mediciones, observaciones resultantes del trabajo de campo, resultados de encuestas, grabaciones de entrevistas e imágenes. La atención se centra en los datos de investigación que están disponibles en forma digital. Los usuarios normalmente pueden acceder, extraer, explotar, reproducir y difundir datos de investigación de libre acceso de forma gratuita.
Tipología de los datos de Investigación, está en función de:
→ Nivel de procesamiento en el curso de la investigación:
- Datos primarios o sin procesar: Datos originales que han sido recolectados pero aún no han sido procesados o analizados. Algunos ejemplos son los registros sonoros, observaciones, notas de campo o datos de experimentos.
- Datos procesados: Datos que han sido digitalizados, traducidos, transcritos, limpiados, validados, verificados y/o anonimizados.
- Datos analizados: Modelos, gráficos, tablas, textos u otros, que han sido creados a partir de los datos primarios y procesados, y que se pretende sean de ayuda en el descubrimiento de información útil, la presentación de conclusiones y la toma de decisiones.
→ Según la fuente de la que provienen:
- Datos canónicos o de referencia: Sets de datos que pueden ser utilizados para validación, comparación o búsqueda de información (por ejemplo, secuencias del genoma humano, estructuras químicas o portales de datos espaciales)
- Datos experimentales: Datos generados en experimentos científicos. Generalmente son reproducibles y pueden ser generados por equipos de laboratorio.
- Modelos o simulaciones: Datos generados en computadores por algoritmos, modelos matemáticos, o simulaciones de experimentos.
- Datos derivados: Sets de datos creados al tomar datos ya existentes y realizar algún tipo de manipulación sobre los mismos.
- Observaciones: Datos generados al registrar observaciones de un evento específico y posiblemente irrepetible, en un lugar y tiempo dados.
→ Según su forma o tipo:
Documentos de texto electrónicos, Planillas de datos, Cuadernos de campo o anotaciones de laboratorio, Cuestionarios o transcripciones, otografías o películas, Registros sonoros, Muestras, artefactos,Objetos digitales, Modelos, algoritmos, scripts, Bases de datos, Metadatos, Esquemas de metadatos, Configuraciones de software, Archivos de pre o post procesamiento de software…
→ Según su formato:
- Textuales (Microsoft Wod, PDF, RTF, ODT, etc.)
- Numéricos (Excel, CSV, etc.)
- Multimedia (JPEG, MPEG, WAV, etc.)
- Estructurados (XML, base de datos MySQL, etc.)
- Código de software (Java, C, etc.)
- Específicos de un software (Mesh, 3D CAD, modelo estadístico, etc.)
- Específicos de una disciplina (FITS en astronomía, CIF en química, etc.)
- Específicos de un instrumento (Olympus Confocal Microscope Data Format, Carl Zeiss Digital Microscopic Image Format)
Un mayor acceso a las publicaciones científicas y los datos ayuda a:
- Construir sobre los resultados de investigaciones anteriores (mejora de la calidad de los resultados)
- Fomentar la colaboración y evitar la duplicación de esfuerzos (mayor eficiencia)
- Acelerar la innovación (un avance más rápido hacia el mercado significa un crecimiento más rápido)
- Involucrar a los ciudadanos y la sociedad (transparencia mejorada del proceso científico).