La visión más completa del genoma humano hasta la fecha permitirá acelerar el diagnóstico de enfermedades raras y cáncer
Investigadores españoles del Centro de Regulación Genómica han participado en la creación del catálogo de variaciones genéticas más completo hasta la fecha descifrando algunas de las regiones más difíciles de identificar y olvidadas del genoma humano. Este avance, que se publica este miércoles en dos artículos en la revista 'Nature', permitirá acelerar el diagnóstico de enfermedades raras y del cáncer.
«Cada genoma humano tiene unas 25.000 variantes estructurales, pero una sola es la que causa enfermedad, por lo que es necesario acotar el espacio de búsqueda, hacer un cribado de variantes. Con las referencias actuales se puede pasar de 25.000 a unas pocas miles, pero sigue siendo buscar una aguja en un pajar. Gracias a esta nueva referencia que liberamos con este trabajo acotamos el espacio de búsqueda a menos de 200 variantes candidatas, lo que facilita muchísimo el diagnóstico genético en la práctica clínica«, ha explicado el doctor Bernardo Rodríguez-Martín, coautor correspondiente del estudio durante la rueda de prensa de presentación de los resultados.
«Este trabajo constituye la referencia más completa de variación genética estructural del genoma humano hasta la fecha. Es un avance hacia la medicina personalizada fundamentada en la información genómica», ha añadido. El experto ha asegurado que ya hay hospitales como el Sant Joan de Deu, que colabora con el CGR, que están utilizando esas tecnologías para la diagnosis de enfermedades raras en niños.
Además, estas nuevas tecnologías se pueden aplicar en el estudio de las mutaciones que generan cáncer. «En un 15% de los pacientes no se encuentra una mutación causal del cáncer y puede ser porque las tecnologías previas no han sido capaces de encontrarla. Otro de los grandes retos es entender la mutación que se acumula a lo largo de nuestra vida. Esta tecnología permite entender cómo acumulamos mutaciones mientras envejecemos y debido a factores ambientales y de estilo de vida con una resolución sin precedentes», añade el investigador, que reconoce que una de las limitaciones es el todavía alto coste de la secuenciación. «Secuenciar un genoma son mil euros. En los últimos cinco años se ha reducido muchísimo, como cinco veces, por lo que podemos imaginarnos un futuro no tan lejano, en unos 5 años, donde el precio se haya reducido lo suficiente y por unos pocos cientos de euros podamos secuenciar un genoma con esta tecnología«, concluye.
En 2003 se secuenció por primera vez el genoma humano. Entonces se descubrió que el 60% del genoma es ADN repetitivo, pero un 8% restante permació sin resolver por su complejidad. En 2015, el proyecto '1000 genomas' secuenció mas de 1000 genomas humanos en 26 poblaciones del mundo, pero la limitación de estas tecnologías, capaces de leer solo el ADN en fragmentos muy cortos, dejó grandes regiones del genoma sin explorar. Entre 2021 y 2023 se resuelve el genoma humano completo gracias a la tencología de lectura larga, pero en una única referencia, y surge el proyecto 'Pangenoma' para ampliar el número de referencias, con 47 individuos de 5 continentes.
Ahora, los investigadores han ampliado significativamente el catálogo de variación genética humana conocida. Los conjuntos de datos resultantes de estos dos trabajos que publica este miércoles 'Nature' constituyen la visión general más completa del genoma humano hasta la fecha. El primer artículo, dirigido conjuntamente por el Laboratorio Europeo de Biología Molecular (EMBL), la Universidad Heinrich Heine de Düsseldorf (HHU) y el Centro de Regulación Genómica (CRG) de Barcelona, analizó los genomas de 1.019 personas extraídas de 26 poblaciones de cinco continentes.
Los investigadores buscaron específicamente variantes estructurales en el genoma humano. Se trata de grandes fragmentos de ADN que han sido eliminados, duplicados, insertados, invertidos o reorganizados. Las diferencias en las variantes estructurales entre individuos pueden implicar cambios en miles de letras del ADN a la vez, lo que a menudo anula genes y propicia el desarrollo de muchas enfermedades raras y cánceres.
El equipo encontró y categorizó más de 167.000 variantes estructurales en los 1.019 individuos, duplicando la cantidad conocida de variación estructural en el pangenoma humano, una referencia que une el ADN de muchas personas en lugar de depender de un solo genoma. Cada persona portaba una mediana de 7,5 millones de letras de cambios estructurales, lo que pone de relieve la gran cantidad de edición genómica que la naturaleza realiza por sí sola.
«Encontramos un tesoro de variación genética oculta en estas poblaciones, muchas de las cuales estaban subrepresentadas en conjuntos de referencia anteriores. Por ejemplo, el 50,9 % de las inserciones y el 14,5 % de las deleciones que encontramos no se habían reportado en catálogos de variación previos. Es un paso importante para mapear los puntos ciegos en el genoma humano y reducir el sesgo que durante mucho tiempo ha favorecido a los genomas de ascendencia europea, y allana el camino para terapias y pruebas que funcionen igual de bien en personas de todo el mundo«, afirma el doctor Bernardo Rodríguez-Martín.
Aproximadamente tres de cada cinco (59%) de las variantes descubiertas se presentaron en menos del uno por ciento de los individuos, un nivel de rareza crucial para el diagnóstico de enfermedades genéticas, ya que puede ayudar a filtrar variaciones inofensivas con mayor eficacia. En las pruebas, el nuevo conjunto de referencia reduce la lista de mutaciones sospechosas de decenas de miles a tan solo unos cientos, lo que acelera el diagnóstico de síndromes genéticos raros y otros tipos de enfermedades como el cáncer.
Bernardo Rodríguez-Martín comenzó a trabajar en el proyecto en el laboratorio de Jan Korbel en el EMBL y lo completó tras trasladarse al CRG para fundar su propio grupo. Desarrolló SVAN, un software que categoriza cada cambio de ADN, como «pieza extra copiada» o «fragmento eliminado», lo que ayuda al equipo a analizar los datos genéticos para discernir nuevos patrones.
SVAN reveló que más de la mitad de la diversidad recién cartografiada en el genoma humano se encuentra en segmentos de ADN altamente repetitivos, partes del genoma que antes se consideraban basura o demasiado difíciles de estudiar. «Los elementos repetitivos representan una reserva rica y previamente ignorada de diversidad genética. Son protagonistas clave de la diversidad humana, las enfermedades y la evolución», afirma Emiliano Sotelo-Fonseca , estudiante de doctorado del CRG y coautor del primer estudio.
Estos segmentos repetitivos de ADN incluyen elementos móviles, también conocidos como «genes saltarines» debido a su capacidad de replicarse en el genoma. Los investigadores descubrieron que, entre los miles de elementos móviles del genoma humano, la mayor parte de la mutagénesis de la línea germinal se deriva de la actividad de unas pocas docenas de elementos altamente activos.
Por ejemplo, se descubrió que un elemento LINE-1 particularmente hiperactivo secuestraba un potente interruptor regulador para producir muchas más copias de sí mismo de lo habitual, dispersando material genético adicional en el ADN de muchas personas. Los investigadores observaron un truco similar con otra clase de genes saltarines llamados SVA.
«Nuestro trabajo muestra cómo los elementos móviles potencian su actividad al secuestrar nuestros botones de regulación genómica, una estrategia poco apreciada que podría contribuir al desarrollo de enfermedades como el cáncer y que merece mayor investigación», afirma el doctor Rodríguez-Martín.
El segundo artículo, dirigido conjuntamente por el Laboratorio Europeo de Biología Molecular (EMBL) y la Universidad Heinrich Heine de Düsseldorf (HHU), utilizó un conjunto de muestras mucho más pequeño de sólo 65 individuos, pero combinó varios métodos de secuenciación potentes para reconstruir los genomas humanos con un detalle sin precedentes.
Este enfoque ayudó a los investigadores a decodificar los tramos más difíciles de leer, incluidos los centrómeros. Los ensamblajes casi completos y sin huecos de cada cromosoma de estos individuos permitieron a los investigadores detectar grandes variantes genéticas en las regiones que no se habían detectado en el primer artículo ni en otros estudios.
Los resultados muestran que combinar el enfoque del primer artículo, con muchos genomas secuenciados a una profundidad modesta, con el enfoque del segundo artículo, con unos pocos genomas con gran detalle, es el camino más rápido hacia un mapa completo e inclusivo de la diversidad genética humana.
«Un estudio utiliza menos potencia de secuenciación, pero una cohorte mucho mayor. El otro utiliza una cohorte más pequeña, pero mucha más potencia de secuenciación por muestra. Esto condujo a conclusiones complementarias», señala el dcotor Jan Korbel , líder de grupo y director interino del EMBL Heidelberg, y coautor principal de ambos estudios.
Ambos artículos resecuenciaron individuos del proyecto 1000 Genomas, la iniciativa histórica que cartografió la diversidad genética global en 2015. El proyecto se basó en tecnología de secuenciación de «lectura corta», que solo podía leer fragmentos muy pequeños de ADN a la vez. Estos fragmentos eran demasiado cortos para revelar grandes fragmentos de ADN faltantes o copiados, largos tramos que cambian de dirección o repeticiones que parecen casi idénticas en muchos puntos.
Los avances logrados en los nuevos estudios fueron posibles gracias a la secuenciación de «lectura larga», una tecnología reciente que lee miles o decenas de miles de letras de ADN de una sola vez, lo que ayuda a los investigadores a encontrar grandes cantidades de variación oculta indetectables con métodos anteriores.
Ambos artículos también suponen importantes avances en la construcción de un pangenoma humano de referencia. Durante los últimos veinte años, los científicos han utilizado la secuencia de ADN de una persona como genoma humano estándar, pero el pangenoma sería más útil para la medicina personalizada, ya que reflejaría la diversidad global.
Al desarrollar algoritmos innovadores que pueden analizar 1.019 genomas diversos en términos de amplitud y 65 genomas ultracompletos en profundidad, los investigadores proporcionan una hoja de ruta que hace que la posibilidad de un verdadero pangenoma humano sea más práctico en lugar de aspiracional, sobre todo porque los costos de secuenciación de lectura larga están disminuyendo.
«Gracias a estos estudios, hemos creado un recurso completo y de relevancia médica que ahora puede ser utilizado por investigadores de todo el mundo para comprender mejor el origen de la variación genómica humana y observar cómo se ve afectada por una gran variedad de factores«, asegura Tobias Marschall, profesor de la Universidad Heinrich Heine de Düsseldorf y coautor principal de ambos estudios. «Este es un excelente ejemplo de investigación colaborativa que abre nuevas perspectivas en la ciencia genómica y un paso hacia un pangenoma humano más completo», concluye.
abc