Los big-data genéticos. Datos médicos y respeto a la privacidad.

Humana communitas. Carta del Papa Francisco
21/01/2019
Los Chalecos Amarillos y la Filosofía.
23/01/2019

Por Nicolás Jouve, Catedrático Emérito de Genética. Publicado en Actuall el 21 de Enero de 2019.

Los Big-Data son métodos de agrupación de grandes cantidades de datos de cualquier tipo, obtenidas por organizaciones y entidades públicas o privadas y procedentes de personas individuales, que se almacenan en medios informáticos y se analizan con algoritmos para diversos fines aplicados. Dejando para otra ocasión las operaciones de captación de datos sobre nuestras aficiones, gustos, lugares que visitamos, etc., que las grandes compañías informáticas, como Google, Amazon, etc. captan a través de nuestro uso de internet y redes sociales, me referiré en este artículo a los de uso en Medicina, que está creciendo rápidamente en los últimos años. Tampoco me referiré en principio a los datos que almacenan los médicos de atención primaria o los especialistas en sus terminales, cuando, no sin cierta perplejidad por nuestra parte, parecen más preocupados en añadir al historial objeto de nuestra consulta todo lo que les decimos que en resolver nuestras dudas sobre el motivo de la misma, sin que esto implique una crítica a su honestidad y profesionalidad. Me refiero a un segundo escalón de datos, los big-data procedentes de los análisis genéticos y genómicos.

La primera secuencia completa de un genoma humano requirió alrededor de 13 años desde su inicio en 1990 hasta su finalización en 2003 y costó cerca de 2 billones y medio de euros. Hoy en día, el uso de los “secuenciadores de última generación” permite hacer lo mismo en 24 horas por no más de mil euros. Este importe no representa un elevado coste en comparación con otras pruebas analíticas de la Medicina actual, por lo que el análisis genómico será cada vez más habitual en la práctica médica personalizada. De hecho, desde que culminó el Proyecto Genoma Humano se están secuenciando genomas individuales a un ritmo de cerca de 230.000 anuales en todo el mundo y para 2025 se prevé que se conocerá el genoma de cerca de 1.000 millones de personas.

Esto está generando cantidades masivas de datos genéticos que se acumulan en bases de datos que se prevén de gran interés en primer lugar para la búsqueda de vías de tratamiento de los pacientes y también para investigar la causa de muchas patologías relacionadas con los genes. Sí estos son los fines no habría mucho que objetar desde un punto de vista ético, con la salvedad de que deberían contar con el consentimiento de las personas de que provienen y conservarse de forma anónima.

El volumen de los datos clínicos, no solo de secuencias de ADN de los genes, sino de toda índole, está aumentando rápidamente, pero tal acumulación de datos tiene muchas consecuencias y no todas son positivas.

En primer lugar está el hecho de que los big-data sobre genomas individuales crecen  a tal velocidad que se ha generado un cuello de botella que pone en entredicho su utilidad dada la falta de claridad de los objetivos. Aún cuando pueden suponer un gran catalizador para avanzar en el conocimiento de las causas de muchas enfermedades, se acumulan tantos datos y tan deprisa que aun no ha dado tiempo a generar información sobre la relación de genes y enfermedades. No es lo mismo, buscar el dato de la secuencia de un gen particular del que se conoce a priori su implicación en una enfermedad, un error localizado en el ADN, que indagar la posible causa de una patología comparando la secuencia de los 3.200 millones de pares de bases del ADN completo, con sus más de 21.000 genes, entre una muestra dada y las almacenadas en los bancos de datos.

La forma de utilizar los datos sería algo así como si una vez conocidos los genomas de 10.000 personas con una enfermedad y los de otras 10.000 sin ella, se utilizase un algoritmo para comparar, encontrar las diferencias y a partir de esta información trabajar sobre qué genes están implicados. El algoritmo puede ser tan simple como comparar la frecuencia con que una cierta variante del ADN aparece en personas con un determinado rasgo o condición, con los que no la tienen. Si la variante aparece junto a un rasgo o condición con una frecuencia significativamente más alta de lo esperado por azar, entonces tendríamos una pista de la posible causa. El problema es cuando se trata de una muestra individual de una persona con una patología nueva o rara, dado que aun no se conocen ni las regiones de ADN no codificante involucradas, ni todas las variantes del ADN implicadas en las más de 5.000 enfermedades monogénicas conocidas, ni es posible este tipo de análisis en las cerca de 1.100 enfermedades poligénicas o las 150 regiones del genoma relacionadas con el cáncer.

Pongamos un ejemplo. Desde hace unos años se tantea la posibilidad en EE.UU de hacer un análisis del “exoma” (solo el 2% del ADN del genoma humano que codifica proteínas) en todos los recién nacidos. La cuestión que se plantea es si realmente se justifican los 65.000 € que puede costar este análisis para detectar en los recién nacidos las variaciones genéticas que podrían estar implicadas en enfermedades genéticas. El problema de este tipo de análisis es relacionar las variaciones en el ADN observadas en el exoma con una posible enfermedad, cuando aun no se conoce cuáles son las secuencias correctas del carácter alterado. A pesar de ello, ya son varios los hospitales pediátricos americanos en los que se están desarrollando actividades de secuenciación del exoma de los recién nacidos. En este sentido, en el Hospital Pediátrico de Boston se ha puesto en marcha el BabySeq Project, diseñado como un ensayo aleatorio y controlado para informar a las familias sobre variantes genéticas detectadas en sus hijos que puedan suponer riesgos de desarrollar enfermedades en fase adulta, monogénicas o incluso cáncer, incluyendo las mutaciones de los genes BRCA1 y BRCA2. Es importante señalar que los  hallazgos resultantes del exoma son solo diagnósticos y no implican el desarrollo infalible de la enfermedad. Este tipo de información genética no es definitivo y es muy posible que muchos de los niños en cuyo exoma se detecte alguna variación génica no lleguen a desarrollar nada en su futuro. Pero sobre todo, no existen aun referencias suficientes de variantes génicas implicadas ni están aun desarrollados los posibles tratamientos en los casos en que aparezcan las presuntas alteraciones.

Seguramente, en un futuro, cuando se conozcan los genes causantes de las numerosas enfermedades que aquejan a la humanidad, incluidas las llamadas enfermedades raras, cuando se abaraten los costos y cuando las bases de datos permitan la detección de las variantes en el ADN implicadas, los datos del exoma pasarán a sustituir a la clásica la prueba de cribado mediante la toma de una muestra de sangre en el talón que se hace a los recién nacidos para detectar algunas de las patologías más comunes. No obstante, por el momento el coste de la secuenciación del exoma es inasumible para un sistema público de salud, aunque ya haya iniciativas privadas que lo estén ofreciendo.

Volviendo a los big-data, está el hecho también de las condiciones en que se han de utilizar y quien tiene acceso a su utilización. La Comunidad Europea marcó como línea prioritaria para el programa de investigación Horizonte 2020 la creación de los big-data para usos clínicos, y en España la creación de este tipo de servicios a la investigación médica quedó regulada en la ley Investigación Biomédica de 2007. Sin embargo, el uso de los datos supone un motivo creciente de preocupación, respecto al respeto a la confidencialidad y no vulnerabilidad de una información tan sensible. El sentido común y la Ley exigen una protección por medio de la anonimización o seudoanomización de los datos, o sea, la eliminación de los datos personales registrados o su señalización con un código que solo permita la trazabilidad e identidad de la procedencia en casos excepcionales. ¿Se está cumpliendo este imperativo legal?, ¿cómo se controla el uso de los datos clínicos de una persona?

En la relación entre el médico y el paciente entran en juego aspectos que pertenecen a la privacidad y vida íntima de la persona afectada, por lo que existe la obligación moral de mantener el secreto de los datos clínicos que se obtienen tras el análisis genético. La confidencialidad sobre los datos genéticos y el respeto a la privacidad de los mismos fue ratificado por el Código de Ética y Deontología de la Organización Médica Colegial española de 2011, en cuyo Art. 58 se señala que: «El médico debe preservar secretos los datos genéticos de los pacientes a los que atiende. Éstos son propiedad del paciente y el médico solo es su custodio.  El médico nunca podrá colaborar para que los datos genéticos se utilicen como elemento discriminatorio».

Nicolás Jouve de la Barreda
Nicolás Jouve de la Barreda
Catedrático Emérito de Genética de la Universidad de Alcalá. Presidente de CiViCa.