Ciencia abierta, principios FAIR y gestión de datos de investigación

jueves,16 noviembre, 2023

Por Maria Luisa Diez Platas

La Ciencia Abierta (Open Science) es un movimiento mundial, en constante crecimiento, que persigue como objetivo el proporcionar una mayor transparencia de los datos y métodos de investigación. Su objetivo último es conseguir una reutilización satisfactoria de publicaciones, métodos y datos, con el objeto de ampliar el acceso a la ciencia y eliminar los obstáculos para que sea compartido con el mayor número de personas.

De las  recomendaciones de la UNESCO sobre recurso educativos abiertos aprobada en 2109 y sobre la situación de los Investigadores Científicos en 2017, se extrae que la Ciencia abierta pretende hacer que la ciencia sea más accesible, inclusiva y equitativa en beneficios de todos y se basa en cuatro pilares (Ilustración 1): conocimiento científico abierto, infraestructuras científicas abiertas, compromiso abierto de los agentes sociales y diálogo abierto con otros sistemas de conocimiento (Understanding open science – UNESCO Biblioteca Digital, s. f.)

Ilustración 1. Pilares de la Ciencia Abierta. Fuente: UNESCO.org – Understanding open science (p:6) following UNESCO Recommendation on Open Science. Documents ((Understanding open science – UNESCO Biblioteca Digital, s. f.)

 

De acuerdo con uno de estos pilares, se pone de relieve la importancia de abrir y gestionar los datos e información de investigación, que hacen vislumbrar un nuevo panorama en los requisitos necesarios que deben cumplir los proyectos de investigación financiados por distintos organismos públicos y privados. En todos ellos, y siguiendo también las directrices de convocatorias europeas se considera, imprescindible, entre otras cosas incorporar un plan de gestión de los datos de investigación.

Ya en la conferencia anual del LIBER 2013, cuyo tema fue “Research Information Infrastructures and the Future Role of Libraries”, Boulton presenta una taxonomía en relación con apertura de la investigación de acuerdo con lo que plantea la Ciencia Abierta, en lo que él denomina “La Revolución en la Ciencia abierta: Datos abiertos y el Rol de las bibliotecas” y que se muestra en Ilustración 2:

Ilustración 2.Taxonomía de la apertura de la ciencia. Fuente(Boulton, 2013)

En esta se distingue como los datos recolectados en la investigación se ponen a disposición para diferentes agentes como datos abiertos y en publicaciones científicas en abierto.

 

Principios FAIR

Una de las primeras consecuencias de la propuesta de la Ciencia Abierta ha sido la definición y diseño, realizados por varias partes interesadas (investigadores, editores académicos, organismos de financiación y representantes de la industria), de un conjunto conciso y consensuado por la comunidad de principios fundacionales conocidos como los principios FAIR (Findable, Accessible, Interoperable, and Re-usable), es decir, Localizable, Accesible, Interoperable y Reutilizable, que fueron publicados por primera vez en “The FAIR Guiding Principles for scientific data management and stewardship«, en la revista Scientific Data (Wilkinson et al., 2016).

El lema fundamental que subyace bajo los principios FAIR es ser “tan abierto como sea posible, tan cerrado como sea necesario” (abierto por defecto)(Principios FAIR: Buenas prácticas para la gestión y administración de datos científicos | datos.gob.es, s. f.)

 

En la definición de los principios FAIR se exponen una serie de requisitos que se resumen en la siguiente ilustración:

Ilustración 3. Requisitos de los principios FAIR. Fuente: Australian National Data Service. FAIR principles.

 

Como se puede observar, estos principios se refieren a tres tipos de entidades: datos, metadatos e infraestructuras y como expone (Wilkinson et al., 2016) se pone énfasis en la capacidad de acción de las máquinas para encontrar acceder, interpretar y reutilizar la información porque los humanos dependen cada vez más del soporte computacional para manejar los datos como resultado del aumento en el volumen, complejidad y velocidad de creación de datos.

No obstante y según (Mons et al., 2017), hay un problema que resolver, ya que los principios FAIR sólo describen las cualidades o comportamientos requeridos de los recursos de datos para su descubrimiento y reutilización académica óptimos  sin especificar requisitos técnicos dejando lugar a múltiples interpretaciones. Es por esto por lo que propone una revisión de los Principios para aclarar qué es y qué no es FAIR.

Por tanto, a medida que crece la información procedente de diversas actividades de investigación se hace más necesario el establecimiento de criterios para poder cumplirlos.

La importancia de alinearse con estos Principios incluso ha dado lugar a recursos que permiten chequear si los datos de investigación que se gestionan son FAIR o no, como el portal que pone a disposición el Australian Research Data Commons (ARDC) en  https://ardc.edu.au/resource/fair-data/.

 

Aunque habría varios aspectos que tratar, en (Hauschke et al., 2021) se pone se señala un aspecto importante con respecto a  la información de investigación que habitualmente suele estar disponible en abierto y actualizada pero que, muy a menudo, no está estructurada y no proporciona información de procedencia al residir en múltiples sistemas heterogéneos y a menudo no accesibles, algo en los que los bibliotecarios ya han detectado hace tiempo y en lo que trabajan de forma continuada.

Una resolución posible es transformar esta información en formato de formato de descripción de recursos (RDF)[1] coherente con una ontología temática, así como analizar los mecanismos existentes para publicar datos como datos abiertos enlazados (Linked Open Data, LOD) y usando tecnologías de la Web Semántica, con lo que se espera que la aplicación de estas medidas creará servicios actualizados para los científicos y mejorará la visibilidad de estos datos.

No obstante, y como se indica en (Mons et al., 2017) se debe tener claro  que FAIR no es igual a RDF, Linked Open Data y Web Semántica y de hecho,  los Principios FAIR no prescriben explícitamente el uso de RDF ni de ningún otro marco o tecnología de la web semántica.

No obstante, RDF junto con las ontologías formales, son actualmente una solución popular al problema de compartir conocimientos que también cumple los requisitos de FAIR lo que hace que las ontologías, los vocabularios y RDF sean adoptados de forma amplia en proyectos que cumplen los principios FAIR, al ser muy eficaces a efectos de interoperabilidad e intercambio de información, en particular a nivel de metadatos y con una contribución importante a la semántica.

Esto no quita que otros formatos de datos puedan ser usado con este fin, teniendo en cuenta que los datos (o partes de ellos) sólo deben exponerse utilizando formatos FAIR si ello aumenta claramente su capacidad de localización, accesibilidad o reutilización.

De acuerdo con esto, existen varias iniciativas para mejorar la implementación de FAIR, como la Initiative for Open Abstracts (I4OA) ( https://i4oa.org) u  OpenAIRE (http://www.openaire.eu), entre otros, que facilitan recolectar y almacenar metadatos de acuerdo con los estándares, identificadores, ontologías y tesauros más confiables. La tendencia es ir más allá de estructuras de datos locales y buscar un marco global que facilite el intercambio de información.

Gestión de datos de investigación

 

Por tanto, es importante señalar que la Ciencia Abierta está cambiando la forma de gestionar y publicar datos de investigación, hasta el punto de que la Comisión Europea requiere que todos los proyectos (con alguna excepción justificada) financiados en el programa Horizon Europe, y también en el anterior Horizon 2020, incorporen un plan de gestión de datos que además garantice el acceso abierto cumpliendo los principios FAIR. Los proyectos nacionales también comienzan a adherirse a estos mandatos.

En este sentido, y como ya se ha comentado, los bibliotecarios llevan la delantera en cuanto a la estructuración, normalización y apertura de datos, por lo que la Red de Bibliotecas Universitarias y Científicas Españolas (REBIUN)[2] junto con la Conferencia de Rectores de Universidades Españolas (CRUE) han confeccionado varias infografías sobre acceso abierto para el programa Horizonte 2020 pero cuya información sigue vigente  para nuevos programas y que pueden servir de referencia, por la información que contienen, para la adopción de estrategias y definición de requisitos en proyectos de investigación que aportan buena información y que está todas descargables en https://biblioteca.ulpgc.es/files/repositorio_de_docum152/material_formativo/infografias-accesoabierto-REBIUN.pdf.

 

Como muestra dos infografías en el que se pone de relieve el proceso al que se deben someter los datos de investigación y los mandatos de gestión y publicación.

Ilustración 4. (REBIUN, CRUE, 2023)

Ilustración 5. Infografias REBUIN. Fuente:https://www.rebiun.org/acceso-abierto/como-cumplir-con-los-mandatos-sobre-gestion-y-publicacion-de-datos-en-horizonte-2020 (REBIUN, CRUE, 2016)

 

Boulton, G. (2013, julio 2). A Revolution in Open Science: Open Data and the Role of Libraries (Professor Geoffrey Boulton at LIBER 2013). https://www.slideshare.net/libereurope/boulton-gsb-presentationlibermunich

Hauschke, C., Nazarovets, S., Altemeier, F., & Kaliuzhna, N. (2021). Roadmap to FAIR Research Information in Open Infrastructures. Journal of Library Metadata, 21(1-2), 45-61. https://doi.org/10.1080/19386389.2021.1999156

Mons, B., Neylon, C., Velterop, J., Dumontier, M., da Silva Santos, L. O. B., & Wilkinson, M. D. (2017). Cloudy, increasingly FAIR; revisiting the FAIR Data guiding principles for the European Open Science Cloud. Information Services & Use, 37(1), 49-56. https://doi.org/10.3233/ISU-170824

Principios FAIR: Buenas prácticas para la gestión y administración de datos científicos | datos.gob.es. (s. f.). Recuperado 15 de noviembre de 2023, de https://datos.gob.es/es/noticia/principios-fair-buenas-practicas-para-la-gestion-y-administracion-de-datos-cientificos

REBIUN, CRUE. (2016). Cómo cumplir con los mandatos sobre gestión y publicación de datos en Horizonte 2020. https://repositoriorebiun.org/handle/20.500.11967/68

REBIUN, CRUE. (2023). Los datos de investigación importan: Gestiona, comparte, publica y reutiliza. https://repositoriorebiun.org/handle/20.500.11967/1318

Understanding open science—UNESCO Biblioteca Digital. (s. f.). Recuperado 15 de noviembre de 2023, de https://unesdoc.unesco.org/ark:/48223/pf0000383323

Wilkinson, M. D., Dumontier, M., Aalbersberg, Ij. J., Appleton, G., Axton, M., Baak, A., Blomberg, N., Boiten, J.-W., da Silva Santos, L. B., Bourne, P. E., Bouwman, J., Brookes, A. J., Clark, T., Crosas, M., Dillo, I., Dumon, O., Edmunds, S., Evelo, C. T., Finkers, R., … Mons, B. (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data, 3(1), 160018. https://doi.org/10.1038/sdata.2016.18

[1] https://www.w3.org/RDF/

[2] https://www.rebiun.org