Newsletter DPT Nro. 52

ISSN 2618-236X

Septiembre / 2020

Proyecto ENCODE

Un caso paradigmático de ciencia abierta

El genoma humano contiene unos 20.000 genes encargados de codificar proteínas, las cuales desempeñan una amplia variedad de funciones (estructurales, mecánicas, bioquímicas y de señalización) dentro de las células. Sin embargo, como las partes codificantes de nuestros genes solo representan alrededor del 2% de todo el genoma, durante las últimas dos décadas se procuró indagar cuál es la función del 98 % restante de nuestro ADN. Uno de los grandes desafíos residió en el mapeo de los elementos funcionales –las regiones que determinan el grado de expresión de los genes– en ese alto porcentaje.

El proyecto Enciclopedia de Elementos de ADN (difundido como ENCODE) se lanzó en 2003, poco después de la primera secuenciación completa del genoma humano, con el objetivo de crear un catálogo de dichos elementos funcionales y perfilar su papel en la regulación génica. Desde entonces, miles de investigadores de todo el mundo se han valido de sus datos para dilucidar diversos aspectos sobre biología del cáncer, enfermedades cardiovasculares y genética humana, entre otros. El propósito principal de ENCODE es identificar y caracterizar los elementos del genoma que podrían tener un rol potencial en la regulación de los genes, algo fundamental para avanzar en el conocimiento sobre cómo funciona el cuerpo humano.

La revista Nature publicó una colección de 14 artículos -de los cuales aquí seleccionamos 3 como fuentes primarias (1) (2) (3)– correspondientes a la tercera fase del proyecto. En 2007, la fase piloto buscó elementos funcionales en el 1% del genoma de unas pocas líneas celulares humanas. Cinco años más tarde, la segunda fase amplió la búsqueda a todo el genoma en más líneas celulares humanas. Ahora, la tercera fase generó un catálogo más completo, con células tomadas directamente de tejidos.

El equipo ENCODE, constituido por un consorcio internacional de aproximadamente 500 científicos, logró publicar un registro online de más de 1.200.000 candidatos a elementos funcionales del ADN en el genoma humano y de roedor (muy similares genómica y biológicamente). Ello representa un relevante aporte para entender la composición del genoma humano, inferir los mecanismos que forman parte de los procesos biológicos normales, así como los que tienen un papel en la manifestación de enfermedades.

Esta Enciclopedia es fácilmente accesible a la comunidad. Se trata de un proyecto ejemplar de colaboración científica y ciencia abierta que ha motivado –hasta hoy- más de 2.000 publicaciones de expertos no pertenecientes a ENCODE, que utilizaron los datos generados por el proyecto.

ENCODE ha comenzado ya su cuarta fase empleando nuevas tecnologías e investigando tipos de células adicionales. Como un recurso vivo, continuará mejorando y creciendo evolutivamente.

(1) Fuente primaria 1: “Expanded encyclopaedias of DNA elements in the human and mouse genomes”. The ENCODE Project Consortium, Jill E. Moore, Michael J. Purcaro, Henry E. Pratt, Charles B. Epstein, Noam Shoresh, Jessika Adrian, Trupti Kawli, Carrie A. Davis, Alexander Dobin, Rajinder Kaul, Jessica Halow, Eric L. Van Nostrand, Peter Freese, David U. Gorkin, Yin Shen, Yupeng He, Mark Mackiewicz, Florencia Pauli-Behn, Brian A. Williams, Ali Mortazavi, Cheryl A. Keller, Xiao-Ou Zhang, Shaimae I. Elhajjajy, Jack Huey, Diane E. Dickel, Valentina Snetkova, Xintao Wei, Xiaofeng Wang, Juan Carlos Rivera-Mulia, Joel Rozowsky, Jing Zhang, Surya B. Chhetri, Jialing Zhang, Alec Victorsen, Kevin P. White, Axel Visel, Gene W. Yeo, Christopher B. Burge, Eric Lécuyer, David M. Gilbert, Job Dekker, John Rinn, Eric M. Mendenhall, Joseph R. Ecker, Manolis Kellis, Robert J. Klein, William S. Noble, Anshul Kundaje, Roderic Guigó, Peggy J. Farnham, J. Michael Cherry, Richard M. Myers, Bing Ren, Brenton R. Graveley, Mark B. Gerstein, Len A. Pennacchio, Michael P. Snyder, Bradley E. Bernstein, Barbara Wold, Ross C. Hardison, Thomas R. Gingeras, John A. Stamatoyannopoulos & Zhiping Weng. Nature, volume 583, pp. 699–710(2020) Open Access. Published: 29 July 2020. DOI 10.1038/s41586-020-2493-4

(2) Fuente primaria 2: “Perspectives on ENCODE”. The ENCODE Project Consortium, Michael P. Snyder, Thomas R. Gingeras, Jill E. Moore, Zhiping Weng, Mark B. Gerstein, Bing Ren, Ross C. Hardison, John A. Stamatoyannopoulos, Brenton R. Graveley, Elise A. Feingold, Michael J. Pazin, Michael Pagan, Daniel A. Gilchrist, Benjamin C. Hitz, J. Michael Cherry, Bradley E. Bernstein, Eric M. Mendenhall, Daniel R. Zerbino, Adam Frankish, Paul Flicek & Richard M. Myers. Nature volume 583, pp. 693–698 (2020) Open Access, Published: 29 July 2020. DOI 10.1038/s41586-020-2449-8

(3) Fuente primaria 3: A large-scale binding and functional map of human RNA-binding proteins

Eric L. Van Nostrand, Peter Freese, Gabriel A. Pratt, Xiaofeng Wang, Xintao Wei, Rui Xiao, Steven M. Blue, Jia-Yu Chen, Neal A. L. Cody, Daniel Dominguez, Sara Olson, Balaji Sundararaman, Lijun Zhan, Cassandra Bazile, Louis Philip Benoit Bouvrette, Julie Bergalet, Michael O. Duff, Keri E. Garcia, Chelsea Gelboin-Burkhart, Myles Hochman, Nicole J. Lambert, Hairi Li, Michael P. McGurk, Thai B. Nguyen, Tsultrim Palden, Ines Rabano, Shashank Sathe, Rebecca Stanton, Amanda Su, Ruth Wang, Brian A. Yee, Bing Zhou, Ashley L. Louie, Stefan Aigner, Xiang-Dong Fu, Eric Lécuyer, Christopher B. Burge, Brenton R. Graveley & Gene W. Yeo. Nature volume 583, pp 711–719 (2020) Open Access. Published: 29 July 2020. DOI 10.1038/s41586-020-2077-3

Fuente Secundaria: “ENCODE3: Publicado el catálogo más completo para interpretar nuestro genoma”, Por Verónica Fuentes. Boletín SINC. N° Número 425. Salud. 30/7/2020