Casi dos décadas después de que el Proyecto Genoma Humano consiguiera el primer borrador de la secuencia de nuestro ADN, investigadores estadounidenses han logrado otro hito biomédico. Se trata de la primera secuencia completa y sin espacios de un genoma humano.
Este trabajo, como se detalla hoy en Science, fue realizado por el consorcio Telómero a Telómero (T2T) que incluyó a investigadores del Instituto Nacional de Investigación del Genoma Humano (NHGRI), de los Institutos Nacionales de Salud; Universidad de California y la Universidad de Washington, en Seattle, entre otros.
Los científicos involucrados aseguran que el análisis de la secuencia completa del genoma aumentará significativamente el conocimiento de los cromosomas, incluidos mapas más precisos de cinco brazos cromosómicos.
Solo esto abre nuevas líneas de investigación que ayudarán a responder preguntas básicas de biología sobre cómo los cromosomas se segregan y dividen correctamente.
El consorcio T2T utilizó la secuencia del genoma ahora completa como referencia para descubrir más de dos millones de variantes adicionales en el genoma humano. Estos estudios ofrecen información más precisa sobre las variantes genómicas dentro de 622 genes que tienen importancia desde el punto de vista biomédico.
En opinión del doctor Eric Green, director del NHGRI, “generar una secuencia del genoma humano verdaderamente completa representa un logro científico increíble, ya que proporciona la primera visión completa de nuestro modelo de ADN”.
“Esta información fundamental -añade- fortalecerá los esfuerzos para comprender todos los matices funcionales del genoma humano que, a su vez, potenciará estudios genéticos de las enfermedades humanas”.
La secuencia del genoma humano ahora completa será particularmente valiosa para los estudios que tienen como objetivo establecer puntos de vista integrales de la variación genómica humana, o cómo difiere el ADN de las personas.
La gran noticia del ADN de 2003
Numerosos grupos de científicos ya han comenzado a utilizar una versión preliminar de la secuencia completa del genoma humano para sus investigaciones.
La secuenciación completa se basa en el trabajo del Proyecto del Genoma Humano, que cartografió aproximadamente el 92% del genoma, y en la investigación realizada desde entonces. Miles de investigadores han desarrollado mejores herramientas de laboratorio, métodos informáticos y enfoques estratégicos para descifrar la secuencia compleja.
Ese último 8% incluye numerosos genes y ADN repetitivo y es comparable en tamaño a un cromosoma completo. Los investigadores generaron la secuencia completa del genoma usando una línea celular especial que tiene dos copias idénticas de cada cromosoma, a diferencia de la mayoría de las células humanas, que tienen dos copias ligeramente diferentes.
Los científicos notaron que la mayoría de las secuencias de ADN recién añadidas estaban cerca de los telómeros repetitivos (extremos largos y posteriores de cada cromosoma) y centrómeros (secciones medias densas de cada cromosoma).
Así, Evan Eichler, de la Universidad de Washington y copresidente del consorcio TDT, opina que “desde que tuvimos el primer borrador de la secuencia del genoma humano, determinar la secuencia exacta de regiones genómicas complejas ha sido un desafío. El plan completo va a revolucionar la forma en que pensamos sobre la variación, la enfermedad y la evolución genómica humana”.
Evan Eichler y un equipo multidisciplinar de unos 100 científicos, dirigido por Adam Phillippy, del NHGRI, y Karen Miga, de la Universidad de California en Santa Cruz, finalmente han logrado el objetivo primigenio.
En un nuevo trabajo que ahora aparece en Science, describen la primera secuenciación de un genoma humano completo. “En el manuscrito genético de la vida estamos viendo capítulos que nunca antes se habían leído”, describe Eichler.
El complicado rompecabezas del ADN
El genoma humano se compone de poco más de 6.000 millones de letras individuales de ADN, aproximadamente el mismo número que otros primates como los chimpancés, repartidas en 23 pares de cromosomas. Para leer un genoma, los científicos primero cortan todo ese ADN en pedazos de entre centenares a miles de letras. Las máquinas de secuenciación leen las letras individuales de cada pieza y los investigadores intentan ensamblar las piezas en el orden correcto.
Como es bien sabido, un genoma es una colección completa de ácido desoxirribonucleico (ADN) de un organismo; esto es, un compuesto químico que contiene las instrucciones genéticas necesarias para desarrollar y dirigir las actividades de todo organismo.
Las moléculas del ADN están conformadas por dos hélices torcidas y emparejadas. Cada hélice está formada por cuatro unidades químicas, denominadas bases nucleótidas. Las bases son adenina (A), timina (T), guanina (G) y citosina (C).
Las bases en las hélices opuestas se emparejan específicamente; una A siempre se empareja con una T, y una C siempre con una G.
Un desafío es que algunas regiones del genoma repiten las mismas letras una y otra vez. Las regiones repetitivas incluyen los centrómeros, las partes que mantienen unidas las dos cadenas de cromosomas y que juegan un papel crucial en la división celular, y el ADN ribosómico, que proporciona instrucciones para las fábricas de proteínas de la célula.
Otras partes repetitivas incluyen nuevos genes que pueden ayudar a las especies a adaptarse. En el pasado, toda esa repetición hacía imposible ensamblar algunas piezas troceadas en el orden correcto. Es como tener piezas de rompecabezas idénticas: los científicos no sabían cuál iba a dónde, lo que dejaba grandes lagunas en la imagen genómica.
Línea celular con un solo genoma
Otro inconveniente al que se han enfrentado los investigadores: la mayoría de las células contienen dos genomas, uno del padre y otro de la madre. Cuando intentan ensamblar todas las piezas, las secuencias de cada progenitor pueden mezclarse, oscureciendo la variación real dentro de cada genoma individual.
Ahora, Eichler recuerda que, a mediados de la década de 2000, mientras intentaban descubrir cómo superar las barreras, “se nos ocurrió la idea de obtener un genoma completo secuenciando solo uno de los genomas en lugar de resolver dos al mismo tiempo”.
Este investigador reconoce que sabía exactamente dónde encontrarlo: de un conjunto de líneas celulares que estaba estudiando el genetista reproductivo de la Universidad de Pittsburgh, Urvashi Surti. Debido a un raro fallo en el desarrollo normal, las células terminan con dos copias del ADN del padre y ninguna de la madre.
Esa línea celular, con un solo genoma, “es lo que hizo posible este ensamblaje del genoma”, explica Erich Jarvis, neurogenetista de la Universidad Rockefeller que ha participado en el nuevo estudio.
A medida que surgía cada nuevo capítulo de nuestro libro genético de la vida, los investigadores se sumergían en la búsqueda de un significado biológico. Por ejemplo, el equipo descubrió niveles inesperadamente altos de variación genética en los centrómeros y otras regiones: “un nuevo cofre del tesoro de variantes que podemos estudiar para ver si tienen un significado funcional”, puntualiza Phillippy.
Los datos ofrecen la base para una nueva era en el estudio de los centrómeros. Los científicos ahora podrán explorar cómo esta variación recién descubierta contribuye a la enfermedad y cómo cambia el ADN del centrómero con el tiempo.
Terremoto de cambios génicos
Los resultados de T2T también apuntan a patrones más complejos de variación en los genes que pueden haber ayudado a crear la especie humana y podrían explicar nuestra rápida evolución.
La secuencia completa del genoma revela que algunos genes asociados con cerebros más grandes son muy variables, explica Eichler. Una persona puede tener 10 copias de un gen en particular, mientras que otras solo una o dos. Esta variación puede significar problemas durante la fertilización, cuando los cromosomas de la madre y del padre se alinean e intercambian piezas.
“Los genes que no coinciden pueden conducir a un terremoto de alteraciones genéticas«, asegura Eichler. Como resultado, “estas regiones se convierten en un crisol tanto para los rápidos cambios evolutivos como para la susceptibilidad a enfermedades, tanto dentro como entre especies”.
Este éxito de un solo genoma no es la última palabra. Los miembros del consorcio ya están trabajando para secuenciar un genoma con diferentes cromosomas heredados de cada progenitor. También están comenzando un esfuerzo de pangenoma para leer las secuencias de ADN completas de cientos de personas de todo el mundo. “El objetivo es crear un genoma humano lo más completo posible, que represente mucha más diversidad humana”, explica Jarvis.
Pero la nueva secuencia ha sido el primer paso indispensable. Como dice Eichler, “ahora tenemos una piedra de Rosetta para observar la variación completa en cientos de miles de otros genomas en el futuro«.
Tecnologías de secuenciación de ADN
Durante la última década, surgieron dos nuevas tecnologías de secuenciación de ADN que produjeron lecturas de secuencias mucho más largas. El método de secuenciación de ADN Oxford Nanopore puede leer hasta un millón de letras de ADN en una sola lectura, con cierta precisión, mientras que el método de secuenciación de ADN PacBio HiFi puede leer unas 20.000 letras con una precisión casi perfecta.
Los investigadores del consorcio T2T utilizaron ambos métodos de secuenciación de ADN para generar la secuencia completa del genoma humano.
Karen Miga, copresidenta del consorcio T2T cuyo grupo de investigación en la Universidad de California está financiado por NHGRI, detalla que al utilizar métodos de lectura larga “hemos hecho avances en nuestra comprensión de las partes más difíciles y ricas en repeticiones del genoma humano. Esta secuencia completa ya ha ofrecido nuevos conocimientos sobre la biología del genoma”.
En esta cadena obligada de declaraciones de los científicos involucrados en este hallazgo, Adam Phillippy, cuyo grupo de investigación en NHGRI dirigió el esfuerzo final, hace hincapié en que la secuenciación del genoma completo de una persona debería ser menos cara y más sencilla en los próximos años.
“En el futuro -dice también-, cuando se secuencie el genoma de alguien, podremos identificar todas las variantes en su ADN y usar esa información para mejorar su atención médica. Verdaderamente, terminar la secuencia del genoma humano fue como ponerse nuevas gafas. Ahora que podemos ver todo claramente, estamos un paso más cerca de entender lo que todo esto significa”.
Única muestra humana
El nuevo genoma de referencia procede de una única muestra humana, aunque no exactamente de una persona. El ADN procedía de una línea celular derivada de un conjunto de células (mola hidatiforme). Estas se forman cuando un óvulo en el útero pierde su propio genoma, pero es fertilizado por un espermatozoide.
La célula resultante termina con dos copias idénticas de cada cromosoma, a diferencia de la mayoría de las células humanas, que tienen dos copias ligeramente diferentes. A pesar de su extraño origen, no hay nada que sugiera algo fuera de lo común con el genoma de la línea celular, asegura Megan Dennis, profesora de Bioquímica y Biología Molecular de la Universidad de California en Davis y miembro del equipo.
El esperma provino de una persona de ascendencia europea. En contraste, el genoma de referencia humano original fue ensamblado por varios individuos, dando lugar a algunos errores.
Como destacan el profesor Langley y su hija Sasha Langley, de la Universidad de Berkeley, alrededor del 90% de la nueva secuencia en realidad proviene de los centrómeros de los cromosomas. Estructuralmente distintas y que contienen largos tramos de ADN repetitivo, estas regiones son difíciles de estudiar por los investigadores.
En los centrómeros se une la maquinaria que separa los cromosomas apareados durante la meiosis (formación de espermatozoides y óvulos), un paso fundamental en la herencia. Contiene grandes cantidades de heterocromatina, o áreas donde el ADN y las proteínas parecen estar más condensados y compactos.
Viejos litigios, nuevos hallazgos
Los genetistas conocen desde hace décadas la heterocromatina, vista como manchas oscuras en los cromosomas. Las teorías actuales sugieren que la heterocromatina juega un papel importante en cómo los genes se activan y desactivan al cambiar partes del ADN a una fase diferente del resto del cromosoma, como gotas de aceite en el agua. Esto crearía efectivamente compartimentos en el núcleo donde genes específicos podrían activarse o desactivarse.
Otro misterio de los centrómeros es cómo y por qué se forman constantemente en el mismo lugar, porque no existe un código genético específico para que lo hagan. Se determinan epigenéticamente, o fuera del genoma.
Los Langley y sus equipos pudieron comparar las secuencias de centrómeros del nuevo genoma de referencia con otras secuencias publicadas, proporcionando evidencia de que los centrómeros humanos, de hecho, pueden moverse un poco. Esto se ha encontrado en otras especies animales.
El descubrimiento que se da a conocer hoy trae, de nuevo, viejos litigios entre científicos, que tuvieron su inicio en febrero de 2001, cuando se presentó El libro de la vida.
Los investigadores del Consorcio Público Internacional y la empresa Celera Genomics, propiedad del científico Craig Venter, se cruzaron graves acusaciones sobre el control de la información que, de hecho, ha supuesto una revolución de la biomedicina.
Como entonces solía repetir en su círculo más íntimo el profesor Ángel Martín-Municio, entonces presidente de la Real Academia de Ciencias y secretario general de la Academia Española de la Lengua (la Española), se trata de una noticia recurrente que, al menos, desde un punto de vista cualitativo, nos venía recordando cada poco tiempo que, más bien antes que después, iban a hacerse públicos los datos acerca de la secuenciación de la totalidad del genoma humano.
Papers
Nurk et al. La secuencia completa de un genoma humano. Science 376. (2022)
Gershmann et al. Patrones epigenéticos en un genoma humano completo. Science 376. (2022)
Vollger et al. Duplicaciones segmentarias y su variación en un genoma humano completo. Science 376. (2022)
Hoyt et al. De telómero a telómero: el estado transcripcional y epigenético de los elementos repetidos humanos. Science 376. (2022)
Aganezov et al. Un genoma de referencia completo mejora el análisis de la variación genética humana. Science 376. (2022)
Altemose et al. Mapas genómicos y epigenéticos completos de centrómeros humanos. Science 376. (2022)