A propósito del intercambio de datos: Abandone la desconfianza y aproveche la oportunidad

https://www.liebertpub.com/doi/10.1089/dna.2021.0501#.YcsR3iLAV0A.twitter

La genómica humana (HG) es el campo de investigación centrado en el análisis de las secuencias de ADN y de sus mutaciones en individuos y poblaciones, con el objetivo de identificar fuertes correlaciones entre la información contenida en el ADN y los perfiles de enfermedades específicas. La investigación sobre HG pretende descubrir patrones de trastornos causados por factores genéticos, anticipar su aparición y permitir intervenciones preventivas. La HG allana el camino a la medicina personalizada y predictiva (Roth, 2019), a una comprensión mucho mejor de la fisiopatología humana y al desarrollo de más opciones de intervención para las enfermedades (Berens y Marchant, 2004; Goodwin et al., 2016).


La idea básica es que cuantos más datos se puedan recopilar y analizar, más exhaustiva será la profundidad de nuestra comprensión de los determinantes genéticos de las enfermedades. De hecho, el uso de grandes conjuntos de datos y la comparación entre diferentes da una mayor confianza estadística a los patrones emergentes. Los grandes conjuntos de datos también facilitan la identificación de eventos de baja frecuencia, asociados, por ejemplo, a la aparición de enfermedades raras, cuya detección sería improbable de otro modo (Francis, 2014).


Los grandes volúmenes de datos plantean la necesidad de contar con enormes plataformas en las que almacenar y analizar los datos y metadatos procedentes de las muestras del estudio. Según OmicsMaps (en desuso en la actualidad), en 2015 se utilizaban >2500 instrumentos de secuenciación de nueva generación de alto rendimiento en >60 países. Las estimaciones de 2015 preveían que, si funcionaban a pleno rendimiento, estos instrumentos tenían la capacidad de generar muchos zettabases (es decir, billones de bases secuenciadas) de datos para 2025, y de secuenciar hasta 2.000 millones de genomas humanos para 2027 (Stephens et al., 2015; The Medical Futurist, 2018). Más recientemente, los proyectos de HG de todo el mundo y sus metadatos se han recopilado en la base de datos Genomes OnLine (GOLD). Su versión actual incluye >1,17 millones de entradas y contiene >600 campos de metadatos. Teniendo en cuenta que un solo genoma humano (en forma de archivo comprimido, compuesto por unas 30 rondas de muestreo para una adecuada calidad de la información) requiere 100 gigabytes para su correcto almacenamiento, la capacidad de almacenamiento de datos tendrá que aumentar drásticamente a medida que la secuenciación del genoma siga aumentando (Fleishman, 2015; Stephens et al., 2015; Mukherjee et al., 2021).


Una vez recogidos y almacenados adecuadamente, los datos deben ser compartidos entre los científicos para apoyar la investigación. Tanto el almacenamiento como la puesta en común de los datos plantean graves riesgos éticos que, de no mitigarse, pueden obstaculizar el desarrollo de la HG y sus numerosos beneficios para la salud humana.


Riesgos éticos de la gestión de los datos genómicos humanos

Uno de los principales riesgos de la recogida y el intercambio de datos de HG es la recuperación de las identidades individuales asociadas a las muestras, y las consiguientes amenazas que esto puede representar en términos de discriminación y estigmatización de los individuos, o de los grupos minoritarios/vulnerables (Mailman et al., 2007; Provost y Fawcett, 2013; Kosseim et al., 2014; Byrd et al., 2020). Para mitigar estos riesgos, se han definido protocolos para compartir y acceder a los datos de forma segura, entre ellos el esbozado por el Centro Nacional de Información Biotecnológica (NCBI) en 2007, el llamado protocolo de "intercambio a petición" (Mailman et al., 2007). Este protocolo se utiliza cuando los datos se comparten dentro de un grupo cercano de participantes, que a menudo colaboran en el mismo proyecto (Byrd et al., 2020).


Cada forma de compartir datos está estrechamente regulada por políticas específicas que, a pesar de tener como objetivo fomentar la aceleración de los descubrimientos, tienen un fuerte enfoque en la protección de la privacidad. El riesgo en este caso es que unas medidas demasiado severas que restrinjan la puesta en común de datos pueden obstaculizar el progreso de la HG y los avances conexos para la salud pública, en particular cuando invaden la puesta en común transfronteriza de datos. Como subrayan Molnár-Gábor y Korbel


"El intercambio de datos a través de las fronteras ha sido transformador para la investigación tanto de las enfermedades raras como del cáncer. Cada enfermedad rara es tan escasa que los centros individuales y a menudo países enteros pueden carecer de las cohortes de pacientes para interpretar la enfermedad de forma significativa. [...] Un ejemplo es la investigación sobre el meduloblastoma infantil, donde el intercambio transfronterizo de datos genéticos y clínicos de los pacientes dentro y fuera de Europa condujo a avances que descubrieron la base hereditaria frecuente de la enfermedad y condujeron a nuevas recomendaciones para la gestión clínica" (Molnár-Gábor y Korbel, 2020).


En las siguientes secciones, nos centramos específicamente en las medidas de gobernanza definidas para los datos de HG en la Unión Europea (UE) para examinar la fricción entre la gobernanza de la UE para la protección de los datos personales y el fomento del progreso en HG.

*** Translated with www.DeepL.com/Translator (free version) ***


Comentarios

Popular

Es hora de que la IA se explique

Ann Cavoukian explica por qué la vigilancia invasiva no debería ser la norma en los entornos urbanos modernos y sostenibles

Gemelos digitales, cerebros virtuales y los peligros del lenguaje