Newsletter DPT Nro. 50
ISSN 2618-236X
Julio 2020
Traducción del pensamiento a texto
Mediante algoritmos de Inteligencia Artificial
Tras una década desde que el habla se decodificó por primera vez a partir de señales del cerebro humano, la precisión y la velocidad de tal decodificación permanecen muy por debajo de las del habla natural.
En el trabajo reseñado, un equipo del Center for Integrative Neuroscience y del Department of Neurological Surgery, ambos de la University of California, San Francisco (UCSF), CA, USA, muestra cómo decodificar el electrocorticograma con alta precisión y con frecuencias de habla natural. Dicho aporte puede resultar útil como base de una prótesis del habla, para personas que, por padecer el síndrome de enclaustramiento (locked-in síndrome) no pueden hablar ni escribir.
En la electrocorticografía (ECoG) se utilizan electrodos colocados directamente sobre la superficie expuesta del cerebro para registrar la actividad eléctrica de la corteza cerebral. El equipo de investigación entrenó a un software de red neuronal recurrente para codificar cada secuencia de actividad neural de longitud de oración en una representación abstracta, y luego decodificar esta representación, palabra por palabra, en una oración en inglés. Para obtener sus resultados, el equipo incorporó a cuatro sujetos participantes a quienes se les implantaron electrodos en el cerebro. Luego, se les pidió que repitieran diferentes oraciones en voz alta mientras el monitor rastreaba sus datos neuronales. Para cada participante, los datos consisten en varias repeticiones verbales de un conjunto de 30 a 50 oraciones únicas (“idioma” restringido), junto con las señales en tiempo real de unos 250 electrodos distribuidos en las cortezas perisilvianas.
Una vez recopilados los datos de las oraciones verbalizadas por cada sujeto, se ingresaron en el algoritmo de aprendizaje automático, que los transformó en una serie de números y los comparó con la grabación de audio. Después de un tiempo, el sistema pudo convertir los números en oraciones en inglés. Inicialmente, las oraciones tenían poco o ningún sentido, pero el algoritmo comenzó a aprender y mejorar a medida que comparaba cada secuencia de palabras con las oraciones que realmente se pronunciaban. Si bien el resultado final no es aún perfecto, el sistema avanzó notablemente en precisión. El proceso de aprendizaje sólo demandó 40 minutos, lo que muestra su rapidez y confiabilidad.
Fuente primaria: “Machine translation of cortical activity to text with an encoder–decoder framework”. Joseph G. Makin, David A. Moses and Edward F. Chang. Tecnical Report. Nature Neuroscience. February 2020. DOI: 10.1038/s41593-020-0608-81
Fuente secundaria: “Scientists Create AI That Turns Thoughts into Text: The end result could prove hugely useful for people who are unable to talk or type”. By Fabienne Lang. Interesting Engineering. April 01, 2020