Datos de investigación

Tags

Datos primarios y Secundarios

MANTRA – John MacInnes – Datos primarios versus datos secundarios (active los subtítulos en español en YouTube) [Fuente: Cepal]

Datos de investigación y tipología

Tags

Qué son los Datos de investigación

Los datos de investigación son aquellos datos que son recolectados, observados o creados para ser analizados y producir resultados de investigación originales. [Fuente: Cepal]

La Comisión Europea define los datos de investigación, a la información, en particular factual o numérica recogida para ser examinada y considerada como la base de un razonamiento, de una discusión o de un cálculo.

En un contexto de investigación, los ejemplos de datos incluyen estadísticas, resultados de experimentos, mediciones, observaciones resultantes del trabajo de campo, resultados de encuestas, grabaciones de entrevistas e imágenes. La atención se centra en los datos de investigación que están disponibles en forma digital. Los usuarios normalmente pueden acceder, extraer, explotar, reproducir y difundir datos de investigación de libre acceso de forma gratuita.

Tipología de los datos de Investigación, está en función de:

Nivel de procesamiento en el curso de la investigación:

  • Datos primarios o sin procesar: Datos originales que han sido recolectados pero aún no han sido procesados o analizados. Algunos ejemplos son los registros sonoros, observaciones, notas de campo o datos de experimentos.
  • Datos procesados: Datos que han sido digitalizados, traducidos, transcritos, limpiados, validados, verificados y/o anonimizados.
  • Datos analizados: Modelos, gráficos, tablas, textos u otros, que han sido creados a partir de los datos primarios y procesados, y que se pretende sean de ayuda en el descubrimiento de información útil, la presentación de conclusiones y la toma de decisiones.

Según la fuente de la que provienen:

  • Datos canónicos o de referencia: Sets de datos que pueden ser utilizados para validación, comparación o búsqueda de información (por ejemplo, secuencias del genoma humano, estructuras químicas o portales de datos espaciales)
  • Datos experimentales: Datos generados en experimentos científicos. Generalmente son reproducibles y pueden ser generados por equipos de laboratorio.  
  • Modelos o simulaciones: Datos generados en computadores por algoritmos, modelos matemáticos, o simulaciones de experimentos.
  • Datos derivados: Sets de datos creados al tomar datos ya existentes y realizar algún tipo de manipulación sobre los mismos.
  • Observaciones: Datos generados al registrar observaciones de un evento específico y posiblemente irrepetible, en un lugar y tiempo dados.

Según su forma o tipo:

Documentos de texto electrónicos, Planillas de datos, Cuadernos de campo o anotaciones de laboratorio, Cuestionarios o transcripciones, otografías o películas, Registros sonoros, Muestras, artefactos,Objetos digitales, Modelos, algoritmos, scripts, Bases de datos, Metadatos, Esquemas de metadatos, Configuraciones de software, Archivos de pre o post procesamiento de software…

Según su formato:

  • Textuales (Microsoft Wod, PDF, RTF, ODT, etc.)
  • Numéricos (Excel, CSV, etc.)
  • Multimedia (JPEG, MPEG, WAV, etc.)
  • Estructurados (XML, base de datos MySQL, etc.)
  • Código de software (Java, C, etc.)
  • Específicos de un software (Mesh, 3D CAD, modelo estadístico, etc.)
  • Específicos de una disciplina (FITS en astronomía, CIF en química, etc.)
  • Específicos de un instrumento (Olympus Confocal Microscope Data Format, Carl Zeiss Digital Microscopic Image Format)

Un mayor acceso a las publicaciones científicas y los datos ayuda a:

  • Construir sobre los resultados de investigaciones anteriores (mejora de la calidad de los resultados)
  • Fomentar la colaboración y evitar la duplicación de esfuerzos (mayor eficiencia)
  • Acelerar la innovación (un avance más rápido hacia el mercado significa un crecimiento más rápido)
  • Involucrar a los ciudadanos y la sociedad (transparencia mejorada del proceso científico).

 

Reutilización de Datos

Tags

¿Qué es la reutilización de datos de investigación?

The definition of reuse. Stephanie van de Sandt , Sünje Dallmeier-Tiessen, Artemis Lavasa, Vivien Petras. Data science journal, 2019, 18(1), p.22. DOI: http://doi.org/10.5334/dsj-2019-022

Photo by Mika Baumeister on Unsplash

La capacidad de reutilizar los datos de la investigación ahora se considera un beneficio clave para la comunidad de investigación en general. Los investigadores de todas las disciplinas se enfrentan a la presión de compartir sus datos de investigación para poder reutilizarlos. La demanda de uso y reutilización de datos tiene implicaciones sobre cómo documentamos, publicamos y compartimos la investigación en primer lugar, y, quizás lo más importante, afecta cómo medimos el impacto de la investigación, que comúnmente es una medida de su uso y reutilización. Es sorprendente que las comunidades de investigación, los encargados de formular políticas, etc., no hayan definido claramente qué uso y reutilización es todavía.

Postulamos que se necesita una definición clara de uso y reutilización para establecer mejores métricas para un registro académico integral de individuos, instituciones, organizaciones, etc. Por lo tanto, este artículo presenta una primera definición de reutilización de datos de investigación. Las características de la reutilización se identifican al examinar la etimología del término y el análisis del discurso actual, lo que lleva a una variedad de escenarios de reutilización que muestran la complejidad del panorama de investigación actual, que se ha estado moviendo hacia un enfoque basado en datos. El análisis subraya que no hay razón para distinguir el uso y la reutilización. Discutimos lo que eso significa para posibles nuevas métricas que intentan cubrir las prácticas de Open Science de manera más integral. Esperamos que la definición resultante permita una estrategia mejor y más refinada para Open Science.

Preservación-Repositorios

Tags

Guía para la evaluación de los procesos de preservación en repositorios institucionales de investigación

Fecha:2020

Resumen:

La presente Guía tiene como finalidad permitir una auditoría interna para establecer posibles acciones de preservación digital en los repositorios institucionales de las universidades y el CSIC. Se engloba dentro de la acción 5 del Grupo de Repositorios de REBIUN para el año 2020. En 2018 el Grupo realizó una encuesta , basada en los niveles establecidos por la National Digital Stewardship Alliance (NDSA), para determinar en qué medida los repositorios están desarrollando actividades de preservación digital. Con una tasa de respuestas del 90% (52 encuestas respondidas de 58 repositorios REBIUN contactados), se pudo concluir que los repositorios no están aplicando las medidas técnicas de preservación al nivel de su compromiso público.
La presente Guía, basada en los mismos criterios NDSA pero ampliada con otras prácticas en preservación digital y con la experiencia de los miembros del grupo de trabajo, pretende servir de referente para plantear a nivel político y técnico los puntos fuertes y las medidas de mejora en cuanto a la preservación de los materiales y metadatos almacenados en los repositorios institucionales.

El informe surgido de aquella encuesta está disponible en:

 https://hdl.handle.net/20.500.11967/253  

Ciencia Abierta

Tags

Videoconferencia: Ciencia Abierta.

Evento «Ciencia Abierta», videoconferencia el día miércoles 18 de noviembre a las 11hs . La videoconferencia se transmitirá por el Canal Youtube UNR Oficial: www.youtube.com/c/UNROficial

Conferencias:

  • Remedios Melero: «Ciencia Abierta: balance y perspectivas a casi 20 años de la Declaración de Budapest»
  • Maria Esteva: «La curación digital como pasos interactivos: la experiencia de DesignSafe-CI, una plataforma para datos de desastres naturales»

Coordina: Paola Bongiovani

Organiza: Comité de Acceso Abierto de la UNR

Auspicia: AUGM – Asociación de Universidades del Grupo Montevideo

 

Ciencia Abierta. Video

Este breve video de Ivo Grigorov, Universidad Técnica de Dinamarca (DTU) presenta los conceptos de Ciencia Abierta y explica cómo deben aplicarse en todo el ciclo de vida de la investigación.

Ciencia abierta: ¡más que acceso abierto a publicaciones! [Fuente: Foster]

https://youtu.be/7Kric3x7zr0

… comparta sus datos. Los datos de investigación que sustentan las publicaciones también deben ser accesibles para respaldar la validación y facilitar la reutilización. En los casos en que la sensibilidad a los datos no permita el acceso abierto, asegúrese de proporcionar detalles sobre cómo alguien podría solicitar acceso autorizado

… comparta su código. Muchos investigadores desarrollan fragmentos de código  diseñados a medida para ayudarles a analizar y visualizar los datos que han recopilado. Tener acceso a este código es esencial para respaldar la validación de sus hallazgos y para ayudar a otros a desarrollar su trabajo.

comparta sus flujos de trabajo. Sin saber qué pasos se tomaron para capturar, procesar y analizar los datos, y en qué orden, puede ser virtualmente imposible validar los hallazgos publicados. Esto ha llevado a lo que algunos llaman la Crisis de Reproducibilidad. El número especial de Nature sobre Challenges in Irreproducible Research  le da una mejor idea de la magnitud de este problema.

Open Science. Pilares

Cuatro pilares de la ciencia abierta

En el curso ofrecido por FOSTER, ¿Qué es Ciencia Abierta? nos ofrece una visión clara de cómo la Ciencia Abierta trata de hacer que los resultados de la investigación sean accesibles para todos en lugar de mantenerlos encerrados detrás de un muro de pagos. La Ciencia Abierta se basa en principios clave. Estos principios se exploran en Do You Speak Open Science? Resources and Tips to Learn the Language.

 

 

 

RECOLECTA: buscador de proyectos

Tags

BUSCADOR DE PROYECTOS. RECOLECTA

La FECYT nos informa que RECOLECTA cuenta con un nuevo servicio de buscador de proyectos: (agencia financiadora de proyectos de investigación) https://buscador.recolecta.fecyt.es/

El nuevo servicio ofrece información de 635.473 proyectos financiados por 24 agencias distintas (de la AGE y las CCAA) para el periodo comprendido entre 2004 y 2016.

buscador manual de proyectos: https://buscador.recolecta.fecyt.es/buscador-recolecta-proyecto

Los próximos pasos serán poner a disposición de la comunidjad RECOLECTA una API de enriquecimiento de repositorios con esta información, e incorporar los datos de los últimos años tanto al buscador manual como a la API.

Lo interesante de la API de enriquecimiento de repositorios, se basaría en el enriquecimiento del campo “patrocinador” de los repositorios (dc.relation) con el estándar de codificación de código de proyecto diseñado por RECOLECTA. De tal forma que bajo cada proyecto se podrían recoger las publicaciones derivadas de dicho proyecto, en el portal de RECOLECTA.