Newsletter DPT Nro. 63

ISSN 2618-236X

Agosto / 2021

CUESTIONES DE INTERES

La secuencia del genoma humano más completa

Obtenida hasta la fecha

El Proyecto Genoma Humano publicó, en la revista Nature de febrero de 2001, el 90% de la secuencia de los 3.000 millones de pares de bases del ADN humano. En 2003 se publicó una versión mejorada y más precisa, considerada hasta ahora como el “genoma humano de referencia” (conocido como GRCh38.p13). Esta versión, que fue actualizada en varias ocasiones, resultó clave para estudiar los mecanismos biológicos que intervienen en las células y tejidos humanos, así como para identificar las causas de múltiples enfermedades. Las técnicas utilizadas en aquel momento no permitieron secuenciar aquellas regiones repetitivas que se encuentran en los extremos de los cromosomas o en las regiones centroméricas. Como resultado, el GRCh38.p13, contiene fragmentos -que totalizan más de 150 millones de pares de bases- cuya secuencia se desconocía.

El consorcio Telomer-to-Telomer (T2T) logró ahora secuenciar, de arriba hacia abajo, 23 cromosomas humanos y obtuvo así la secuencia más completa de un genoma humano hasta la fecha. Los investigadores reconstruyeron 3.050 millones de pares de bases de la secuencia, completando información faltante en el GRCh38.p13. El objetivo del Consorcio T2T, creado en 2019, es completar las regiones de secuencia desconocida y generar el primer ensamblaje completo de un genoma humano. En esta línea, el Consorcio publicó en 2020 el ensamblaje completo (de extremo a extremo) de un cromosoma X humano y, más recientemente, anunció la secuenciación de los cromosomas 8 en la especie humana, en chimpancé, orangután y macaco. Este estudio, publicado en Nature, permitió resolver algunas regiones que arrastraban imprecisiones desde hacía 20 años, analizar el cromosoma 8 desde una perspectiva más precisa, así como establecer su historia evolutiva.

El genoma obtenido por el consorcio T2T (al que denominan T2T-CHM13) corrige algunos de los errores en versiones anteriores e incluye 182 millones de pares de bases no incluidos en el GRCh38.p13, así como un análisis detallado de los cromosomas 8. Además, el análisis preliminar de la secuencia sugiere la presencia de más de 2.500 nuevos genes, de los que 140 podrían codificar proteínas.

Los resultados del Consorcio T2T muestran que es posible secuenciar cromosomas humanos enteros, sin dejar huecos. El genoma T2T-CHM13 ofrece una imagen más completa y precisa del genoma humano, pero tampoco es completa. En primer lugar, las células que los investigadores utilizaron incluían el cromosoma sexual X pero carecían de cromosoma Y. Por tanto T2T-CHM13 no refleja la totalidad de los cromosomas humanos y todavía quedan algunos fragmentos por resolver completamente. Otro reto por abordar técnicamente en el futuro es la secuenciación de genomas completos en células diploides, que tengan dos copias diferentes de cada cromosoma. Romper esta barrera ofrecerá una visión completa de la variabilidad genética en el genoma humano.

Los investigadores del Consorcio T2T consideran al genoma T2T-CHM13 como más completo, representativo y preciso que el GRCh38, y plantean que sucederá o desplazará a este último en los futuros estudios que requieran una secuencia de referencia.

No puede aún predecirse si el genoma T2T-CHM13 reemplazará al GRCh38 como “genoma humano de referencia” o si se utilizarán ambos a la vez. En la actualidad miles de investigadores trabajan con GRCh38 y las posiciones de referencia son únicas para todos. Como todos ellos navegan con el mismo mapa, introducir otro genoma de referencia requeriría adaptar muchas herramientas y asignar nuevas coordenadas a los elementos genéticos.

En cualquier caso, cabe tener presente que el genoma de referencia es sólo una herramienta y que ésta no captura la variación genómica existente en la especie humana, formada por millones de genomas humanos diferentes.

Referencias:

Fuente primaria 1: “The structure, function and evolution of a complete human chromosome”. Glennis A. Logsdon, Mitchell R. Vollger, PingHsun Hsieh, Yafei Mao, Mikhail A. Liskovykh, Sergey Koren, Sergey Nurk, Ludovica Mercuri, Philip C. Dishuck, Arang Rhie, Leonardo G. de Lima, Tatiana Dvorkina, David Porubsky, William T. Harvey, Alla Mikheenko, Andrey V. Bzikadze, Milinn Kremitzki, Tina A. Graves-Lindsay, Chirag Jain, Kendra Hoekzema, Shwetha C. Murali, Katherine M. Munson, Carl Baker, Melanie Sorensen, Alexandra M. Lewis, Urvashi Surti, Jennifer L. Gerton, Vladimir Larionov, Mario Ventura, Karen H. Miga, Adam M. Phillippy & Evan E. Eichler. Nature 593, 101–107. 2021. Published: 07 April 2021. Open Access. DOI: 10.1038/s41586-021-03420-7

Fuente primaria 2: “The complete sequence of a human genome” Sergey Nurk, Sergey Koren, Arang Rhie, Mikko Rautiainen, Andrey V. Bzikadze, Alla Mikheenko, Mitchell R. Vollger, Nicolas Altemose, Lev Uralsky, Ariel Gershman, Sergey Aganezov, Savannah J. Hoyt, Mark Diekhans, Glennis A. Logsdon, Michael Alonge, Stylianos E. Antonarakis, Matthew Borchers, Gerard G. Bouffard, Shelise Y. Brooks, Gina V. Caldas, Haoyu Cheng, Chen-Shan Chin, William Chow, Leonardo G. de Lima, Philip C. Dishuck, Richard Durbin, Tatiana Dvorkina, Ian T. Fiddes, Giulio Formenti, Robert S. Fulton, Arkarachai Fungtammasan, Erik Garrison, Patrick G.S. Grady, Tina A. Graves-Lindsay, Ira M. Hall, Nancy F. Hansen, Gabrielle A. Hartley, Marina Haukness, Kerstin Howe, Michael W. Hunkapiller, Chirag Jain, Miten Jain, Erich D. Jarvis, Peter Kerpedjiev, Melanie Kirsche, Mikhail Kolmogorov, Jonas Korlach, Milinn Kremitzki, Heng Li, Valerie V. Maduro, Tobias Marschall, Ann M. McCartney, Jennifer McDaniel, Danny E. Miller, James C. Mullikin, Eugene W. Myers, Nathan D. Olson, Benedict Paten, Paul Peluso, Pavel A. Pevzner, David Porubsky, Tamara Potapova, Evgeny I. Rogaev, Jeffrey A. Rosenfeld, Steven L. Salzberg, Valerie A. Schneider, Fritz J. Sedlazeck, Kishwar Shafin, Colin J. Shew, Alaina Shumate, Yumi Sims, Arian F. A. Smit, Daniela C. Soto, Ivan Sović, Jessica M. Storer, Aaron Streets, Beth A. Sullivan, Françoise Thibaud-Nissen, James Torrance, Justin Wagner, Brian P. Walenz, Aaron Wenger, Jonathan M. D. Wood, Chunlin Xiao, Stephanie M. Yan, Alice C. Young, Samantha Zarate, Urvashi Surti, Rajiv C. McCoy, Megan Y. Dennis, Ivan A. Alexandrov, Jennifer L. Gerton, Rachel J. O’Neill, Winston Timp, Justin M. Zook, Michael C. Schatz, Evan E. Eichler, Karen H. Miga, Adam M. Phillippy. bioRxiv. 2021. DOI: https://doi.org/10.1101/2021.05.26.445798

Fuente primaria 3: “Telomere-to-telomere assembly of a complete human X chromosome”. Miga, K.H., Koren, S., Rhie, A. et al. Nature 585, 79–84. 2020. DOI: https://doi.org/10.1038/s41586-020-2547-7

Fuente secundaria: “La secuencia más completa del genoma humano”. Por Amparo Tolosa, Genotipia. Genética Médica News.10/06/2021