Análisis comparativo de las infraestructuras bibliográficas abiertas y comerciales
De-Moya-Anegón, Félix; Sánchez-Jiménez, Rodrigo; Halevi, Gali; Guerrero-Bote, Vicente P.; Guerrero-Castillo, Pablo; Rivadeneyra, Federico (2026). A Comparative Analysis of Open and Commercial Bibliographic Infrastructures: Scale, Metadata Standardization, and Implications for Bibliometric Evaluation. Granada: Ediciones Profesionales de la Información, 48 pp. ISBN: 978-84-125757-8-1.DOI: https://doi.org/10.3145/aca
Este informe evalúa la viabilidad estructural de las infraestructuras bibliográficas abiertas con fines de evaluación de la investigación, prestando especial atención a cómo se comparan las principales bases de datos abiertas con Scopus en términos de cobertura, calidad de los metadatos, transparencia, interoperabilidad e idoneidad para los flujos de trabajo de evaluación de la investigación.
Si bien los marcos normativos recientes, como la Coalición para el Avance de la Evaluación de la Investigación (CoARA) y la Declaración de Barcelona, exigen una transición hacia los datos de investigación abiertos, un análisis empírico revela un cuello de botella crítico: una disyuntiva estructural entre la escala y la estandarización de los metadatos. Plataformas como OpenAIRE, que agrega más de 150 millones de registros, y plataformas bibliográficas abiertas como OpenAlex y The Lens, cada una con más de 200 millones de registros, superan significativamente el volumen de publicaciones cubierto por las bases de datos comerciales curadas, sobre todo Scopus, a lo largo del periodo analizado de 1996 a 2024.
Las capacidades de ingesta masiva de las plataformas abiertas se ven contrarrestadas por limitaciones sustanciales en campos clave de metadatos. Los datos de afiliación están ausentes en más del 55 % de los registros, lo que limita gravemente la viabilidad de las evaluaciones institucionales, y los identificadores clave, como los ISSN y los DOI, presentan niveles de exhaustividad significativamente inferiores a los de Scopus. La clasificación de los tipos de documentos también carece con frecuencia de rigor editorial, ya que se basa en gran medida en el etiquetado algorítmico, que no estandariza de manera coherente la categorización de los resultados académicos.
Además, el análisis de los flujos de citas revela una dinámica marcadamente asimétrica: la extensa cola larga de las bases de datos abiertas funciona principalmente como una fuente de referencia que refuerza los indicadores de impacto del núcleo comercial ya establecido, en lugar de redistribuir sustancialmente el impacto medido a través del corpus académico más amplio. De este modo, la bibliografía adicional que las fuentes abiertas pretenden incorporar sirve, en última instancia, para reforzar la prominencia de las publicaciones ya representadas en las bases de datos comerciales. Este hallazgo apunta a una paradoja estructural en las infraestructuras académicas abiertas y plantea cuestiones importantes que merecen una mayor reflexión e investigación.
Informe. Tensiones y soluciones en la relación propiedad intelectual – investigación abierta. Raquel de Román. Madrid: Federación Española de Sociedades de Archivística, Biblioteconomía, Documentación y Museística (FESABID), 2026 



