Mujer Paralizada Recupera la Voz con Interfaz Cerebro-Computadora Revolucionaria

Para las personas que han perdido la capacidad de hablar debido a afecciones como accidentes cerebrovasculares o trastornos neurológicos, las interfaces cerebro-computadora (BCI) ofrecen una vía prometedora para la comunicación. Los recientes avances en la tecnología BCI se han centrado en acelerar la traducción de los pensamientos en habla, abordando un obstáculo significativo que anteriormente había hecho que el proceso fuera lento y antinatural. Ahora, los investigadores han desarrollado un nuevo proceso BCI que permite a una mujer que sufrió un derrame cerebral hace casi dos décadas comunicarse en tiempo real, convirtiendo sus pensamientos en palabras con una velocidad y claridad sin precedentes.

Un avance innovador en la tecnología de interfaz cerebro-computadora (BCI) ha permitido a una mujer que sufrió un derrame cerebral en el tronco encefálico hace casi dos décadas recuperar la capacidad de traducir sus pensamientos en habla en tiempo real. Este proceso innovador, desarrollado por investigadores estadounidenses, aborda una limitación significativa de los métodos BCI anteriores: el frustrante retraso entre el pensamiento y la vocalización. Al analizar la actividad cerebral en incrementos rápidos de 80 milisegundos y sintetizarla en una versión de la propia voz de la mujer, este nuevo enfoque logra un flujo de comunicación mucho más natural y fluido.

Nuestra capacidad inherente para comunicar pensamientos como sonidos es una función que a menudo damos por sentada. Solo cuando nos enfrentamos a retrasos, como los experimentados con traductores o retroalimentación de audio retardada, apreciamos verdaderamente la velocidad y la eficiencia de nuestra propia anatomía. Para las personas cuya capacidad de producir habla se ha visto afectada por afecciones como la esclerosis lateral amiotrófica (ELA) o lesiones en el sistema nervioso, los implantes cerebrales junto con software especializado han ofrecido un atisbo de esperanza para recuperar esta función vital.

Los últimos años han sido testigos de avances monumentales en los proyectos de traducción de habla BCI, todos ellos esforzándose por reducir el tiempo necesario para generar habla a partir de los pensamientos. Sin embargo, la mayoría de los métodos existentes requieren que se procese un fragmento completo de texto antes de que el software pueda descifrar su significado. Este procesamiento secuencial alarga significativamente los segundos entre el inicio de un pensamiento y su vocalización, creando una experiencia antinatural y, a menudo, frustrante para el usuario.

Este retraso es un obstáculo importante para lograr una conversación dinámica y fluida. Como destacan los investigadores de la Universidad de California en Berkeley y San Francisco en su informe publicado, “Mejorar la latencia de la síntesis del habla y la velocidad de decodificación es esencial para la conversación dinámica y la comunicación fluida”. Este desafío se ve agravado por el hecho de que “la síntesis del habla requiere tiempo adicional para reproducirse y para que el usuario y el oyente comprendan el audio sintetizado”, explica Kaylo Littlejohn, ingeniero informático de la Universidad de California, Berkeley, que dirigió el equipo.

Además, un requisito común de la mayoría de los métodos BCI existentes es que el ‘hablante’ debe entrenar activamente la interfaz intentando vocalizar abiertamente. Esto puede ser un desafío importante para las personas que no están acostumbradas a hablar o que siempre han experimentado dificultades con la producción del habla, ya que proporcionar al software de decodificación suficientes datos de entrenamiento se vuelve problemático.

Para superar estos obstáculos críticos, los investigadores emplearon un enfoque novedoso. Entrenaron una red neuronal flexible y de aprendizaje profundo en la actividad de la corteza sensoriomotora de la participante de 47 años mientras ‘hablaba’ silenciosamente 100 oraciones únicas extraídas de un vocabulario de poco más de 1.000 palabras. Además de esto, Littlejohn y sus colegas también utilizaron una forma asistida de comunicación basada en 50 frases utilizando un conjunto más pequeño de palabras, proporcionando un enfoque multifacético para la recopilación de datos.

Fundamentalmente, a diferencia de los métodos anteriores, este proceso no requería que la participante intentara vocalizar. El sistema se entrenó únicamente en su actividad cerebral mientras pensaba silenciosamente las oraciones en su mente. Esto eliminó la necesidad de producción física del habla durante la fase de entrenamiento, haciéndolo accesible a personas con graves problemas del habla.

Los resultados de este nuevo enfoque fueron significativos, demostrando una marcada mejora en la velocidad de decodificación. El número promedio de palabras por minuto traducidas fue casi el doble que el de los métodos anteriores. Más importante aún, el uso de un método predictivo que podía interpretar continuamente las señales neuronales sobre la marcha permitió que el habla de la participante fluyera de una manera mucho más natural. Este procesamiento en tiempo real resultó en una velocidad de comunicación 8 veces más rápida que otros métodos. Sumado a la naturalidad, el habla sintetizada incluso sonaba como su propia voz, gracias a un programa de síntesis de voz basado en grabaciones previas de su habla.

El potencial de esta tecnología se extiende más allá del vocabulario entrenado. Ejecutando el proceso sin conexión sin limitaciones de tiempo, el equipo demostró que su estrategia podría incluso interpretar señales neuronales que representaban palabras para las que no había sido entrenado deliberadamente. Esto sugiere un grado de generalización y adaptabilidad en el sistema, lo que insinúa su potencial para decodificar una gama más amplia de pensamientos e intenciones.

Si bien el progreso es notable, los autores reconocen que aún queda un margen considerable de mejora antes de que el método pueda considerarse clínicamente viable. Aunque el habla sintetizada era inteligible, aún no alcanzaba el nivel de precisión logrado por los métodos que decodifican texto. Es necesario un mayor refinamiento y desarrollo para mejorar la precisión y la naturalidad del habla traducida.

Sin embargo, considerando los rápidos avances en la tecnología BCI en los últimos años, hay amplias razones para el optimismo. La capacidad de traducir los pensamientos en habla en tiempo real representa un paso monumental para las personas que han perdido su voz. La perspectiva de que aquellos que no tienen la capacidad de hablar pronto puedan comunicarse de manera fluida y natural es un testimonio de la dedicación y el ingenio de los investigadores en este campo y del potencial transformador de los dispositivos de lectura de la mente. Esta investigación innovadora se publicó en la prestigiosa revista Nature Neuroscience.

Una mujer paralizada por un derrame cerebral ha recuperado la capacidad de comunicarse en tiempo real gracias a una nueva interfaz cerebro-computadora que analiza la actividad cerebral rápidamente y sintetiza voz, superando los retrasos de tecnologías anteriores. Este innovador enfoque, que no requiere vocalización durante el entrenamiento y utiliza una síntesis de voz personalizada, logra una comunicación significativamente más rápida y natural, sugiriendo un futuro donde quienes no tienen voz puedan reconectarse con el mundo. Se necesita más investigación, pero este avance ofrece una inmensa esperanza y subraya el notable potencial de la neurotecnología.

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *