Desde hace más de una década, el movimiento Open Access ha permitido poner a disposición de los investigadores el texto completo de numerosas revistas, facilitando con ello el acceso universal a los avances científicos. Revista Española de Cardiología apostó desde el principio por esta modalidad de publicación, así como la edición bilingüe en español y en inglés de su versión electrónica, lo que ha mejorado su difusión y su impacto internacionales1. Un paso más en este sentido es la apertura de los datos brutos que sirven de soporte a la investigación para compartirlos y reutilizarlos, lo que en terminología sajona se conoce como data-sharing. Este movimiento ya está bien implantado en algunas áreas como la genética. Así, las dos mayores entidades financiadoras del Proyecto Genoma Humano, el Wellcome Trust2 y el National Institutes of Health3, han invertido en la infraestructura necesaria para compartir datos a gran escala y a largo plazo y han desarrollado normativas al respecto. En el área de las enfermedades cardiovasculares también se han hecho llamamientos en este sentido, poniendo un énfasis especial en la necesidad de compartir los datos de los ensayos clínicos controlados, una vez consideradas las necesarias medidas para proteger la intimidad de los pacientes4–6.
Las ventajas de compartir los datos de las investigaciones son bien conocidas: los investigadores tienen mayores oportunidades de descubrir nuevos conocimientos; aumenta el número de análisis estadísticos enmascarados; estimula los descubrimientos adicionales; evita la repetición de costosos proyectos que utilizan los mismos medicamentos o aparatos que se utilizaron previamente; muchos fraudes podrían reducirse si otros investigadores pudieran comprobar los datos. En síntesis, permite que muchas investigaciones se puedan hacer con costes mínimos aprovechando los datos ya existentes, con lo que se consigue un mayor aprovechamiento de los recursos7.
Sin embargo, en la mayor parte de las áreas biomédicas, salvo en genética, la revolución que supone compartir datos se mueve muy lentamente y los investigadores suelen ser reacios a hacerlo, por lo que los datos de investigación están infrautilizados8. Muchos investigadores desconfían de liberar los datos detallados por miedo a que análisis externos de otros puedan contradecir las interpretaciones iniciales. La publicación de estudios adicionales incorrectos crearía una espiral de confusión que desorientaría a la comunidad científica internacional y la distraería de otras labores. Otros argumentan que han dedicado mucho tiempo y esfuerzo en el diseño y la recolección de los datos y, por lo tanto, desean ser ellos quienes difundan los resultados y no otros que no han participado en este proceso. Por otra parte, piensan que en el futuro pueden obtener nuevas observaciones adicionales de sus propios datos, por lo que ofrecerlos en abierto les impediría explotarlos si investigadores oportunistas han hecho uso de ellos previamente. La solución en este caso pasaría por proteger la autoría de los investigadores originales durante un periodo de tiempo y por establecer una política de incentivos, de manera que quienes comparten sus datos deberían tener ciertas ventajas frente a quienes no4–6.
A pesar de que todavía hay muchos asuntos sin resolver, la comunidad científica ha empezado el proceso de desarrollo de normativas y soluciones a los problemas más comunes que van surgiendo. En España, el Grupo de Trabajo de «Depósito y Gestión de datos en Acceso Abierto» del proyecto RECOLECTA ha elaborado un informe9 que refleja los aspectos relevantes que intervienen en la gestión de los datos de investigación en los repositorios científicos. Por otra parte, el Ministerio de Economía y Competitividad subvenciona el proyecto «OpenDataScience, centro de recursos para la preservación y gestión de datos abiertos de investigación», que tiene como objetivo fomentar el intercambio y la reutilización de los datos primarios de investigación de manera generalizada y normalizada10. También las fundaciones privadas están interesadas en investigar en este campo y, por ejemplo, la Fundación Mapfre subvenciona el proyecto «Estrategias para la gestión y la promoción del uso compartido de datos científicos sobre la salud», con propósitos similares al anterior pero centrados en el campo de las ciencias de la salud11.
En definitiva, pensamos que es necesario concienciar a los profesionales para que liberen sus datos de investigación, pero también crear infraestructuras que faciliten su depósito y preservación y las reglas de juego que aclaren muchas de las implicaciones que una estrategia de estas características supondría. Las revistas científicas con versiones electrónicas poseen la tecnología apropiada para permitir el depósito y la consulta de estos datos, y este es el caso de Revista Española de Cardiología, que acepta el envío de material electrónico adicional en varios formatos para apoyar y mejorar la presentación de la investigación científica (aunque desde abril de 2013ha restringido el acceso abierto de algunos de sus contenidos en la web). Por otra parte, también es necesario crear repositorios institucionales y temáticos de datos para que los investigadores puedan depositar allí los suyos con garantías de salvaguarda. Queda mucho por hacer, pero el proceso de apertura y uso compartido de los datos científicos se presenta imparable.
FINANCIACIÓNPlan Nacional de I+D+I del Ministerio de Economía y Competitividad. Fundación MAPFRE.