Mutaciones: mucho más que cambios de nucleótidos
Imagen: Vectorarte/freepik

Cuando se habla del complejo mundo de las mutaciones es fácil caer en la idea más común: se trata de un cambio de un nucleótido (o de varios) por otro (s) o, si se prefiere, la sustitución de los aminoácidos que codifican. Pero las mutaciones son mucho más. En lo referido al coronavirus pandémico SARS-CoV-2 tienen, además, gran importancia evolutiva y patogénica.

Esbozo de la estructura genómica del SARS-CoV-2

El largo genoma del coronavirus pandémico SARS-CoV-2 contiene cerca de 30.000 nucleótidos (letras). Hay dos partes bien diferenciadas (Figura 1, abajo): un sector que secuencia 16 proteínas no estructurales (nsp 1-16) y otro sector genómico que secuencia las 4 proteínas estructurales que conforman la anatomía del virus (Figura 1, arriba): S (pico/espiga), E (envoltura), M (membrana) y N (nucleocápside), amén de varios genes más que codifican otras tantas proteínas auxiliares.

Figura 1. Diagrama del coronavirus pandémico (arriba) y representación esquemática (abajo) de su genoma. Crédito: Modificado de JBSD

El gen S codifica la glicoproteína espiga. Lo forman dos subunidades (S1 y S2) que contienen 16 dominios. Interesa destacar ahora dos: el dominio de unión al receptor (Binding Receptor Domaine, BRD) y el dominio N-terminal (N-Terminal Domaine, NTD) (Figura 2). La glicoproteína S, codificada por el gen S, es una proteína vírica que sirve al coronavirus, cuando llega a la proximidad de la célula del hospedador, para unirse a la membrana celular (receptor ACE2). Es el mecanismo de inicio de la invasión celular.

El dominio de unión al receptor o RBD (Figura 2, en verde) está localizado en la subunidad S1 y es una estructura de solo 273 aminoácidos. Los cambios estructurales y funcionales producidos tras la unión de RBD con el receptor ACE2 en el SARS-CoV2 tienen una potencia entre 10 y 20 veces mayor que la de su pariente SARS-CoV, el coronavirus causante de la epidemia de 2002-2003 surgida de murciélagos y civetas.

Figura 2. Estructura primaria del gen S coloreado por dominios. NTD, dominio N terminal; RBD, dominio de unión al receptor; S1/S2, sitio de fusión de la furina; S2′ sitio de escisión de la proteasa; FP: péptido de fusión; HR1, repetición hepádica 1; CH: hélice central; CD, dominio del conector; HR2, repetición hepádica 2; TM: dominio transmembrana; TC: cola citoplasmática. Las flechas marcan los sitios de escisión de la proteasa. Crédito: Modificado de Science

Se comprende que la proteína S sea un objetivo primordial de la respuesta inmunitaria vehiculada por los anticuerpos: para la unión y la neutralización mediada por los anticuerpos naturales, vacunales (prevención) y terapéuticos (terapia mono y policlonal). De mismo modo, es fácil entender que el dominio RBD de la proteína S sea un lugar preferido para la aparición de las numerosas mutaciones presentes en las variantes víricas todavía in crescendo (desde la ya remota D614G y la alfa hasta la nueva ómicron). En resumen, RBD está ligado, por definición, a las mutaciones. Pero no se debe olvidar a su vecino el dominio NTD (Figura 2, en azul).

Las mutaciones no son solo cambios o sustitución de nucleótidos

Una mutación es un cambio o error genético ocurrido durante la replicación de los virus. Las mutaciones en los virus RNA son la norma biológica. Ocurren por azar. La mutación puede ser beneficiosa, perjudicial o indiferente para el virus. Respecto al hospedador (aquí, el ser humano), y simplificando, el cambio mutacional en el virus puede resultar beneficioso o perjudicial. Es fácil suponer que lo que beneficia la aptitud del virus (mayor infectividad, mayor virulencia, más capacidad de evadir la respuesta inmune) perjudicará al humano (más contagios, infección más grave y letal, ineficacia de las vacunas y tratamientos). Porque algunos cambios en el genoma permiten al virus adaptarse mejor (cumpliendo la ley de Darwin) para seguir replicándose y alcanzar una difusión eficaz. Buena prueba son los linajes mutantes D614G, alfa, delta y ómicron que han barrido el planeta en olas sucesivas.

El perjuicio para el virus quiere decir que una o varias mutaciones le impiden perpetuarse: es decir, bloquean o cortan la replicación. Por fin, indiferente es la mutación que ni mejora ni empeora (mutación neutra) su supervivencia. Las mutaciones neutras conforman la inmensa mayoría de los cambios replicativos naturales.

Mecanismos de producción de mutaciones

Los mecanismos por los que ocurren las mutaciones son tres: sustitución, deleción e inserción.

  • La sustitución supone el cambio de uno o más nucleótidos. Y, como consecuencia, de los aminoácidos codificados porque cada tres nucleótidos (un codón) genera la síntesis ribosómica de un aminoácido. Una sustitución es sinónima cuando no hay modificación en la secuencia de la proteína viral y es no-sinónima si el cambio del codón (el triplete de nucleótidos) afecta a la estructura y a la función de la proteína.
  • La deleción es la pérdida de uno o más nucleótidos durante la replicación. Puede haber una pérdida de un único codón (es decir, la pérdida de un aminoácido) o puede ocurrir una mutación denominada de cambio de marco de lectura, lo cual significa que todos los codones siguientes en la lectura replicativa también cambian.
  • La inserción durante el fenómeno de la replicación vírica supone añadir o incorporar (no sustituir ni perder) uno o más nucleótidos en la secuencia genética original. Habrá nuevos nucleótidos en la secuencia genómica y aminoácidos en la proteína sintetizada.

Cantidad y cualidad de las mutaciones

Las sustituciones, deleciones e inserciones, es decir, las mutaciones suceden en el coronavirus de forma aleatoria. Una enzima polimerasa (hoy utilizada como diana terapéutica) regula este mecanismo. Se calcula que ocurren unas 25 mutaciones al año en el coronavirus pandémico, lo que supone una media en torno a dos cambios mensuales. Hasta abril de 2021, cuando se habían secuenciado 1.57 millones de genomas en GISAID correspondientes a 187 países y territorios, se detectaron 857 mutaciones con un mínimo de 100 secuencias. Del total de cambios, 816 (95,2%) fueron sustituciones y 37 (4,3%) deleciones. Las inserciones, cuantitativamente, son muy raras (0,4%).

Es obvio que las sustituciones dominan desde el punto de vista cuantitativo. Por tanto, la cantidad de cambios importa, pero también se debe valorar su cualidad. La recién llegada variante ómicron (B.1.1.529) lo ha puesto en evidencia: exhibe un gran número de mutaciones (más de 50) a lo largo de todo el genoma coronavírico, la mayor parte (35, siendo 32 no-sinónimas) ubicadas en el gen S y, sobre todo, en el RBD (hay 10 mutaciones); algunas mutaciones en ómicron son nuevas, pero otras (por ejemplo, K417N, T478K, N501Y y E484A) eran ya conocidas para los investigadores por haber sido detectadas previamente en otras variantes de preocupación (VOC). Pero, además de su llamativa cantidad, en ómicron también es interesante tener en cuenta el tipo de mutaciones. Su cualidad.

El gen S, diana para los anticuerpos y sitio de siembra de mutaciones

La acumulación de mutaciones en el gen S es la norma porque, en general, la mayor parte de las mutaciones de importancia evolutiva para el coronavirus y de importancia epidemiológica y clínica para el ser humano se detectan en dicho gen. Así ocurrió tras la aparición de la primera mutación de interés en la espiga (D614G, dominio S2 del gen S) detectada a principios de 2020. D614G incrementó la contagiosidad del coronavirus pandémico porque, funcionalmente, desestabiliza el trímero S y aumenta la interacción del dominio de unión al receptor (RBD), un sector esencial de la proteína S, con la enzima convertidora de angiotensina 2 (ACE2) de la membrana celular (recordamos que, respecto a esta función, SARS-CoV-2 ya superaba en 10-20 veces a su pariente SARS-CoV-1). Al aumentar la carga viral en el tracto respiratorio superior de los pacientes con Covid-19, D614G mejora la transmisión del SARS-CoV-2. Esta es la razón por la que D614G se convirtió, en pocas semanas, en el coronavirus mutado predominante en todo el mundo. Y en la actualidad existe en todas las variantes.

Pero esto fue solo el comienzo del baile mutacional. A lo largo de 2020 y a principios de 2021, de modo progresivo o casi simultáneo, fueron apareciendo otras mutaciones de importancia. Todas, cada una a su manera, han ido modificando la aptitud o capacidad del coronavirus. Esta aptitud le sirvió para ser más contagioso (incremento de los índices de reproducción), más agresivo (menor Ct/mayor carga vírica) y poder eludir al sistema inmunitario humano y soportar algunas vacunas. Las citadas mutaciones por sustitución definen a cada una de las variantes de preocupación (destacamos, simplificando, los principales cambios individuales): variante alfa (mutación N501Y), beta y gamma (N484K y K417N/T), delta (L452R) y la citada ómicron.

Las deleciones y su importancia evolutiva y patogénica

Estudiar el papel de las deleciones es muy interesante porque, si ocurren en una determinada zona de epítopos, pueden modificar la respuesta inmunitaria (evasión inmune). Recordamos que un epítopo es una zona específica de la superficie de un antígeno que interactúa con los anticuerpos específicos a los cuales se une; como norma, un antígeno tiene varios epítopos diferentes. Cuatro de las cinco variantes de preocupación (alfa, beta, delta y ómicron) presentan también deleciones o pérdida de nucleótidos, además de numerosas sustituciones (mucho más allá de las citadas).

Las deleciones suelen estar ubicadas habitualmente en el dominio N-terminal (NTD o N-Terminal Domaine) del genoma vírico vecino del RBD (Figura 2, en azul). El NTD es una estructura potencialmente mutable porque tiene regiones propensas a la deleción que pueden permitir que el virus escape de la neutralización de anticuerpos. Se denominan regiones de deleción recurrente (RDR). Aunque se describieron inicialmente cuatro RDR (McCarthy et al, Science), hay algunos más.

Algunas deleciones de interés y el minimalismo antigénico

Figura 3. Trímero de la glicoproteína S (gris) unida al receptor celular ACE2 (arriba, verde). En azul, las deleciones/inserciones. Crédito: GISAID

Un artículo de medRxiv informa de que la prevalencia de las deleciones en NTD aumentó durante la expansión de casos en todo el mundo, con especial relevancia en India y en Chile. También se informa de la presencia de deleciones de NTD en muestras de SARS-CoV-2 de pacientes con Covid-19 que habían sido infectados antes (reinfecciones) y en sujetos que ya estaban completamente vacunados (156/164del con la vacuna Pfizer y V69/H70del, Y144del y A88del con la Johnson&Johnson).

Una eliminación de NTD (F157/R158del) aumentó más de 13 veces de febrero a abril de 2021 en India, lo que la convierte en la quinta región de deleción recurrente (RDR). En Chile, en la misma fecha, una deleción (246del) asociada a una sustitución (D253G) de NTD aumentó 38,4 veces en prevalencia, en un brote independiente de las dos variantes predominantes (alfa y gamma). Esta eliminación estaba presente en una de las dos variantes principales circulantes en el país (linaje C.37).

Es muy interesante saber que el supersitio donde ocurren las anteriores deleciones es una diana de los anticuerpos neutralizantes. Para los autores del estudio citado las deleciones 156/164del (vacunados) y 167/174del (no vacunados con Covid-19 grave) representan una huella genética histórica y la futura trayectoria de la estrategia de minimalismo antigénico (Figura 4) empleado por el SARS-Cov-2 para evadir la inmunidad natural y la vacunal.

Por otra parte, es interesante decir que en el aspirado traqueal de un paciente inmunodeprimido también se encontraron las deleciones Y144del y H146del a los 67 y 72 días del diagnóstico, respectivamente. Como se ha dicho en otra ocasión, los sujetos inmunodeprimidos infectados con SARS-CoV-2 pueden ser auténticas fábricas de mutaciones. A la luz de lo dicho, las deleciones importan.

Figura 4. Representación del minimalismo antigénico. De izquierda a derecha, el antígeno del coronavirus pandémico original (1) es bloqueado por un anticuerpo neutralizante (2). La deleción del sitio antigénico (3) provoca un antígeno minimalístico que elude la neutralización por anticuerpos (4)

Se han descrito deleciones en cuatro de las cinco variantes de preocupación (VOC) y en tres variantes de interés (VOI). Respecto a las VOC, la variante alfa tiene tres deleciones en el NTD: H69/V70del y Y144del. La Y144del permite al coronavirus eludir (escape inmune) a los anticuerpos dirigidos contra dicha zona del genoma.

Por otra parte, se sabe que la porción más expuesta del NTD en la superficie del virión es un punto caliente para las mutaciones de pico. Existe evidencia preliminar de que al menos la deleción H69/V70del, podría mejorar la condición adaptativa. La variante beta también presenta tres deleciones 241/242/243del en el dominio NTD. La variante gamma no tiene deleciones en NTD. La variante delta, la que domina en la actualidad el panorama epidemiológico planetario, porta la deleción 156del. En cuanto a ómicron, tiene varias deleciones en el NTD: 69/70del, V143del, Y144del, Y145del y N211del.

Respecto a las VOI, entre las seis aceptadas (épsilon, zeta, eta, iota, kappa y lambda), solo lambda presenta las deleciones 247/253del. La variante B.1.525 (eta) descrita en el Reino Unido y en Nigeria presenta las deleciones H69/V70del y la Y144/145del en el NTD, mientras que la variante iota (B.1.526) detectada en Nueva York solo tiene la deleción Y144del. Recordamos que la deleción H69/V70del está incluida en las variantes de preocupación alfa y ómicron.

De gran interés es saber que, junto a las deleciones, ocurren determinadas sustituciones como si hubiera una estrategia de evolución concertada para la evasión inmune. Pero en el NTD (Figura 2, en azul), no solo hay deleciones o pérdidas de nucleótidos. También puede haber inserción de genes.

Las inserciones como nuevo asunto de preocupación

Las inserciones son la familia pobre de los cambios genómicos en el coronavirus pandémico, a pesar de su incuestionable importancia evolutiva. Y tal vez patogénica. Es un hecho contrastable que las inserciones han merecido, hasta ahora, menos atención de los investigadores y tienen nula presencia en los medios de comunicación y en las redes (salvo para un grupo selecto de excelentes investigadores tuiteros). Tal vez se debe a su rareza (en torno al 0,4% de las mutaciones) y a la dificultad de interpretación de su significado porque se conoce su mecanismo, pero no está definitivamente aclarado su origen. Muy probablemente tienen trascendencia patogénica, además de evolutiva.

Las inserciones son menos aleatorias que otro tipo de mutaciones. Requieren de una fuente de origen del RNA, de naturaleza vírica o animal. Aunque pueden ocupar entre uno y nueve codones (secuencian 1-9 aminoácidos), el 99% tienen tres codones (secuencian 3 aminoácidos). La trascendencia de este tipo de mutaciones se comprende porque una sola inserción de 12 nucleótidos, en la que subrayamos los dos codones o tripletes centrales (CCT-CGG-CGG-GCA) que codifican cuatro aminoácidos (PRRA, o prolina-arginina-arginina-alanina) en el gen de la espiga S permitió la adquisición evolutiva del sitio de escisión de la furina (S1/S2 en la figura 1).

El sitio de fusión de la furina fue un avance evolutivo del virus

El sitio de fusión de la furina es de capital importancia para la entrada del virus en la célula hospedadora, tras la unión al receptor ACE2 de membrana. Los tripletes nucleótidos centrales CGC-CGG (C de citosina y G de guanina) de la secuencia codifican el aminoácido arginina (representado por la letra R), aquí el doblete RR (arginina-arginina), que es único en el SARS-CoV-2. Este importante sitio de corte es un determinante evolutivo de patogenicidad del coronavirus pandémico. Es, por decirlo de modo gráfico, la llama que prendió la pandemia humana. La citada inserción es inexistente o muy rara en algunas especies de murciélagos incluido el RatG13, que es el virus zoonótico genéticamente más cercano al SARS-CoV-2 (Figura 5).

Figura 5. Ubicación de los tripletes de nucleótidos (CCTCGGCGGGCA) y los aminoácidos (en rojo, PRRA) en el SARS-CoV-2 humano y su ausencia en el genoma del BatCoV-RatG13, el coronavirus zoonótico (murciélagos) genéticamente más cercano al SARS-CoV-2. Crédito: A. Romeu y E. Ollé, en La Haine.org

Marco Gerdol et al, investigadores de las universidades italianas de Trieste y Verona, comunicaron (bioRxiv del 9 de diciembre de 2021) la aparición independiente de 41 eventos de inserción distintos en el mismo sitio NTD. Estos eventos están localizados entre Val213 y Leu214. Por analogía con los RDR de las deleciones, denominaron al sitio Región de Inserción Recurrente1 (RIR1). Dos linajes portadores del RIR1 (B.1.214.2 y A.2.5) tuvieron una gran propagación internacional, si bien fue transitoria y, por fortuna, sin causar efectos deletéreos. Como se señaló antes, también hay inserciones en algunos sujetos inmunodeprimidos con infección prolongada. De modo experimental, se han logrado en el laboratorio mediante el pasaje en cultivo celular en células Vero.

La presunta importancia de las inserciones

Cabe especular que las inserciones RIR1 tienen importancia por suponer una ventaja evolutiva y apoyar la evolución convergente. Convergente, en el sentido evolutivo, significa una presión selectiva positiva que ocurre al azar cuando dos variantes tienen la misma mutación sin que haya conexión entre los casos. El virus mutado mejora la aptitud biológica. Hasta ahora, no parece que las inserciones participen en el escape inmunitario, aunque se está analizando su intervención en la respuesta de los linfocitos T por su impacto en los epítopos T. Finalmente, parece existir una correlación entre la mutaciones RIR1, la aparición de sustituciones no-homónimas en el sitio RBD y ciertas deleciones RDR comentadas con anterioridad.

El origen genómico de las inserciones

¿De dónde proceden? Esta pregunta es muy interesante porque, desde el punto de vista teórico, las inserciones pueden proceder de material genómico del propio virus, de otros virus o del hospedador (animal o humano). En cuanto a la primera posibilidad, se produce por incorporación de material genético de regiones distales del mismo genoma coronavírico. Más raramente, el material genómico procedería de algún coronavirus endémico coinfectante. La posibilidad más rara, y trascendente, es la procedencia del RNA del hospedador humano.

En cuanto a la última opción, Thomas Peacock y colaboradores, del Imperial College de Londres, han publicado recientemente (11 de octubre 2021) datos muy interesantes y provocativos: inserciones en una región del dominio NTD y en el sitio de escisión de la furina S1/S2 (Figura 6) que, como está dicho, son puntos de acceso para deleciones.

Figura 6. Distribución de las inserciones en la proteína S. Están anotados los linajes de interés y las inserciones con alto número de secuencias asociadas

Al buscar el posible origen de las inserciones, el grupo de Peacock encuentra que algunas son duplicaciones de codones adyacentes o de pares de codones. Un ejemplo es la inserción ins678QT, presente en varios linajes. Otras (como la de 12 nucleótidos en el sitio S1/S2 propia del denominado linaje AT.1 ruso) proceden de otra parte del genoma. AT.1 (Figura 6) presenta alta homología con la región 3’ UR del genoma de SARS-CoV-2. Los cambios genómicos son el resultado de una recombinación de elección de copia, un mecanismo habitual durante la síntesis de ARN coronavírico: es un cambio de plantilla por el que se producen ARN subgenómicos (sgRNAs).

Finalmente, otras inserciones pueden proceder del RNA del hospedador humano. Mediante la metodología apropiada, los autores compararon las inserciones con el transcriptoma del hospedador (el transcriptoma es el conjunto de transcriptos o lecturas de genes presentes en una célula). Una agrupación (clúster) de virus en Virginia (USA), las variantes B.1.1.519 y B.1.1.7, presentaron una inserción de 12 nucleótidos (ins390EMPV) en la proteína N del coronavirus que tiene alta homología con el transcripto humano ZBTB20. La variante Mu (B.1.621), descrita en Colombia y Ecuador, tiene una inserción (insY144S/Y145N) con alta homología con el transcripto humano TRIM28.

La existencia de otras inserciones del hospedador y de otros virus en coronavirus del subgénero embecovirus, en flavivirus (como los pestivirus bovinos) y en algunos virus de la gripe (H7N3) son argumentos esgrimidos por Peacock et al en apoyo de su hipótesis, a la vez que sugieren que estos cambios pueden actuar como mutaciones comodín (wildcard) alterando el fenotipo del virus emergente. La hipótesis abre nuevas interrogantes entre las muchas que rodean a este extraordinario virus zoonótico. Los mismos autores informaron dos meses más tarde (en diciembre 2021) de un análisis genético equivalente en la variante ómicron encontrando una alta homología entre la inserción (ins214EPE) hallada en esta variante y el mRNA TMEM245 humano (Figura 7).

Figura 7. Comparación de las secuencias de nucleótidos del coronavirus original de Wuhan (WT), la variante ómicron y el TMEM245 humano

En apoyo de lo anterior, A.J. Venkatakrishnan y colaboradores, del grupo Nference de USA, India y Canadá, encuentran (preprint) la inserción (ins214EPE) en la variante ómicron del coronavirus pandémico. Los autores estudian 1523 linajes víricos que conforman 5.4 millones de genomas de 200 países y territorios entre diciembre de 2019 y noviembre de 2021 (archivo GISAID) y los comparan con las VOC y VOI vigentes. Por otra parte, detectan 26 mutaciones en ómicron (23 sustituciones, 2 deleciones y una inserción) diferentes a las conocidas en VOC/VOI. La inserción ins214EPE no ha sido descrita antes en ningún otro linaje. Es específica, de momento, de ómicron.

El origen incierto de la ‘ins214EPE’

En cuanto a su origen, cabe la posibilidad de proceder de un coronavirus respiratorio endémico (el mejor candidato es HCov-229E) por coinfección en un mismo hospedador: a su favor, se ha detectado una secuencia nucleotídica idéntica en HCoV-229 E y, por otra parte, existe coexpresión de receptores de SARS-CoV-2 (receptor ACE2) y de HCoV-229E (receptor ANPEP) en los enterocitos y en las células ciliares respiratorias humanas. Esto sugiere la posibilidad de que el hospedador humano pueda actuar como sitio de interacción genética (los autores lo denominan evolutionary sandbox) recordando, como señalamos en otro artículo en Biotech Magazine & News, el fenómeno del tubo de ensayo traqueal porcino en la génesis de las pandemias gripales.

También la inserción puede proceder de otros virus respiratorios no coronavíricos. O que, como está dicho, el origen sea humano. En este sentido, en línea con los datos de Peacock et al, los investigadores de Nference detectan numerosos fragmentos del transcriptoma albergando secuencias de nucleótidos idénticas a la secuencia de ins214EPE. En concreto, hay más de 750 fragmentos del genoma humano con secuencias de nucleótidos idénticas a la secuencia codificadora de ins214EPE. Incluyen los ARNm de SLCA7 y TMEM245.

Conclusión

Las sustituciones/cambios de nucleótidos son un mecanismo primordial en la aparición, el incremento y la variedad de los linajes evolutivos del coronavirus original WuHu-1 que inició la pandemia. Como ha demostrado la evolución de los acontecimientos, es incuestionable que numerosas de estas mutaciones tienen importancia epidemiológica (mayor difusión) y patogénica (mayor gravedad y evasión inmune).

Pero otros tipos de cambios, como las deleciones y las inserciones, tienen mucho interés. Las primeras, situadas en el dominio N terminal, porque pueden estar ligadas a la evasión inmune de los anticuerpos neutralizantes, además de que su detección parece seguirse de brotes de casos en menos de tres meses.

El significado de las inserciones, alguna de conocida trascendencia en la historia evolutiva del coronavirus pandémico, está aún pendiente de ser dilucidado. Tal vez actúen como mutaciones permisivas compensadoras de déficits de infectividad de otras mutaciones. Todo un mundo en continuo cambio.

Dejar respuesta

Please enter your comment!
Please enter your name here