En individuos que cursaron su primer episodio psicótico alcanza el 75% de predictibilidad

Crean análisis automatizado del lenguaje para predecir probabilidad de desarrollar esquizofrenia

Análisis automatizado del discurso predice riesgo de esquizofrenia
Según explica la profesora Figueroa, "este trabajo es bien relevante no sólo porque está en línea con lo último que se está investigando en psiquiatría en muchos lugares en el mundo, sino que también es el primero que se hace con hispanohablantes. Además, propusimos un modelo de análisis ajustado no solo al castellano, sino también a nuestra variable dialectal; es decir, al español de Chile”.
Profesora Alicia Figueroa Barra
Profesor Mauricio Cerda

El equipo de académicos está liderado por Alicia Figueroa-Barra, lingüista y miembro del Departamento de Psiquiatría Sur, postdoctorada del Instituto de Neurociencia Biomédica e investigadora del Núcleo Milenio para Mejorar la Salud Mental de Adolescentes y Jóvenes, Imhay, e integrante del Laboratorio de Psiquiatría Traslacional Psiquislab. De nuestro plantel trabajaron junto a ella en este proyecto, que partió como Fondecyt de Iniciación, los profesores Mauricio Cerda, también del BNI, del programa de Biología Integrativa del Instituto de Ciencias Biomédicas  y subdirector del Centro de Informática Médica y Telemedicina; Manuel Durán y Camila Valderrama, igualmente del CIMT; y el doctor Pablo Gaspar, de la Clínica Psiquiátrica Universitaria, de Psiquislab y del Departamento de Neurociencia. Además, contó con la colaboración de expertos de otras entidades nacionales y trasandinas.   

Según destaca la profesora Figueroa, “este trabajo es bien relevante no sólo porque está en línea con lo último que se está investigando en psiquiatría en muchos lugares en el mundo, sino que también es el primero que se hace con hispanohablantes. Además, propusimos un modelo de análisis ajustado no solo al castellano, sino también a nuestra variable dialectal; es decir, al español de Chile”. En ese sentido, explica que “desde hace unos diez años se está incorporando el lenguaje como parte de la evaluación clínica del paciente psiquiátrico; no solamente como la dimensión comunicativa del sujeto, sino como parte de sus síntomas. Hoy se ha avanzado enormemente en la pesquisa de estos biomarcadores lingüísticos, pero no se ha llegado todavía al consenso de un modelo, porque también enfrentamos problemas como la diversidad que ocurre a partir del idioma. Por ejemplo, la longitud de las palabras en español es mayor que en inglés; además los chilenos somos voceantes, pues decimos palabras como “tenís”, “querís”, “cachay”, entonces debimos tomar una serie de decisiones en torno a eso, y encontramos resultados que son particularmente importantes para un modelo en español”.

Buscando rasgos de pérdida de coherencia

De esta forma, el artículo “Automatic language analysis identifies and predicts schizophrenia in first-episode of psychosis”, publicado el 1 de junio de 2022 en Nature Schizophrenia –una de las revistas de mayor relevancia en el área- muestra el trabajo que hicimos en cuanto a la extracción de información automatizada a partir de entrevistas psiquiátricas, con el propósito de elaborar un modelo predictivo de psicosis”. En ese sentido, agrega que “analizamos 133 entrevistas abiertas que se realizaron tanto a personas sanas como a individuos que tuvieron su primer episodio de psicosis y a pacientes ya diagnosticados con esquizofrenia”.

Para eso, en primer término los investigadores transcribieron de forma manual todas las entrevistas clínicas y de tipo fenomenológico –hechas, en el caso de los pacientes, por médicos del área de salud mental- “para hacer un pre procesamiento con el fin de extraer algunas palabras que en el fondo generan “ruido” en el modelo”, dice la profesora Figueroa.

Y es que el equipo contaba “con un modelo previo, basado en mi tesis doctoral, en la que hice este análisis de manera manual, estudiando 60 entrevistas de pacientes para hacer un ranking de  rasgos más significativos respecto de la pérdida o mantención de la coherencia discursiva en sujetos con esquizofrenia de larga evolución y de individuos que estaban iniciando en esta enfermedad, que también comparé con un grupo control”.

El valor predictivo de la coherencia semántica

En cuanto a la creación del algoritmo para el análisis automático, el profesor Mauricio Cerda - ingeniero en computación y especialista en procesamiento de señales e imágenes- recuerda que “el doctor Pablo Gaspar nos explicó lo que es la esquizofrenia y el estudio de las estadísticas lingüísticas como aporte al diagnóstico de esta patología. Y la profesora Figueroa nos mostró qué parámetros se podían medir, labor que cuando se hace a mano tiene mucha variabilidad. Así vimos cómo sistematizar las diferencias entre los grupos estudiados –sanos, primer episodio y crónicos-, para ver si son estadísticamente significativas y ahí probamos una serie de variables”.

De esta forma, estudiaron características agrupadas en tres ámbitos: fluidez verbal, productividad verbal y coherencia semántica. La primera, dice la profesora Figueroa, apunta a la continuidad discursiva e incluye elementos como pausas y vacilaciones; y es que los silencios generalmente se reconocen como parte de trastornos formales del pensamiento en el examen del estado mental, “en particular si duran más de dos segundos y la frecuencia de aparición por unidad de tiempo”, añade el profesor Cerda.

La productividad verbal se refiere a la capacidad de pronunciar una serie de palabras y oraciones, tales como el número total de palabras y diferentes palabras por oración, longitud promedio de palabra y determinante o recuento de pronombres. En pacientes con esquizofrenia se considera una característica inherente una productividad verbal baja o pobreza de expresión.  

Y la coherencia semántica consiste en la organización lógica de significado en el discurso a través de estructuras lingüísticas interrelacionadas. Por ejemplo, “las personas con esquizofrenia cambian de tema de conversación abruptamente; pasan de responder lo que se les pregunta a hablarte de su perro o de cualquier otra cosa, sin que haya una continuidad entre medio”, dice el profesor Cerda. Además, “el uso erróneo y laxo de palabras o expresiones afecta la concordancia y comprensión del habla, por lo que el oyente tiene que hacer un esfuerzo para entender”, agrega la profesora Figueroa.

De esta forma, más que analizar palabras específicas, estudiaron un conglomerado de rasgos de importancia. Así, hicieron estimaciones de qué tan denso es el vocabulario dependiendo de la cantidad de veces que se repite una palabra en determinado contexto o tiempo. “También encontramos que las pausas también son un rasgo bien llamativo, pues si bien hay latencias en la interacción que son comunicativas y que responden a un intento de mantener la tensión, hay otras latencias donde no hay fonación que no se justifican en ese momento y que si superan los dos segundos son claramente anómalas”. Así, “lo primero que hicimos fue sistematizar y comparar más de 30 de estas características, para ver cuáles funcionan o no”.

¿Hay características que son más significativas que otras?

Prof. Cerda: Sí, en los tres niveles, porque en una persona con esquizofrenia lo que está alterado es la estructura de pensamiento, que se refleja de diferentes maneras. Pero en cuanto hacer posible predecir si es que una persona con primer episodio sicótico va a derivar en esquizofrenia, la coherencia es un factor mucho más significativo que otros. O sea, si yo tuviera que preguntar solo una cosa, esa sería coherencia, porque es más informativa respecto de cómo le va a ir en el diagnóstico futuro.

Prof. Figueroa: La coherencia tiene relación con el funcionamiento global de la administración del discurso, porque muestra que hay un grado mucho más profundo del manejo de los recursos que está afectado. Llegando a ese punto es seguros de que estamos frente a un discurso deteriorado que difiere enormemente del de las personas sanas.

En consecuencia, el profesor Cerda explica que “la aproximación que hicimos para generar este aprendizaje automático fue definir las características; por ejemplo, en el tema de las pausas uno puede buscar cuántas fueron mayores a dos segundos aparecen por hora. Al tener las características definidas, entrenamos un algoritmo de clasificación automático con un primer subconjunto de entrevistas y después medimos la exactitud en un subconjunto distinto de entrevistas. Este algoritmo también nos informa que variables son más relevantes en la predicción. Concretamente es un grupo de árboles de decisiones, en donde la coherencia es la característica que está más arriba en ese árbol”.

Llamativos resultados

En un análisis longitudinal y para predecir qué pacientes con primer episodio psicótico se convertirían o no en pacientes con esquizofrenia, los investigadores compararon los resultados de aplicar el análisis del lenguaje respecto de estudiar a los mismos grupos sólo en base a datos demográficos o sus respuestas en pruebas PANSS -escala de los síndromes positivo y negativo, uno de los instrumentos más utilizados por especialistas para valorar la sintomatología de los pacientes con esquizofrenia- o a todos estos factores combinados entre sí. 

“Usando solo información demográfica del paciente, los resultados fueron malos: 43,33% de exactitud; pero mejoraron al cruzarlo con la información del PANSS, llegando a 65,83%. La información de PANSS, por sí sola, permitió una precisión de exactitud del 67,5%; curiosamente, la extraída del análisis del lenguaje proporcionó un 75,83 % de exactitud. Y cuando toda la información se combinó y se seleccionaron las diez características principales en el análisis del lenguaje, se logró una exactitud de 77.5% para predecir si un paciente con primer episodio llegaría a un diagnóstico confirmado de esquizofrenia”, explica el profesor Cerda.

En este punto, la profesora Figueroa hace énfasis en que este método de análisis automatizado del lenguaje no apunta a reemplazar otras herramientas diagnósticas y exámenes, sino que a complementarlos. “Es interesante porque hay una intuición en general por parte de los psiquiatras de que hay elementos llamativos en el paciente a partir de su discurso. Este algoritmo sistematiza información preeminente que no es posible de ser analizada a simple vista y mucho menos en el dinamismo de un intercambio clínico; viene a corroborar las sospechas y a poner en alerta, a partir de información concreta, medible y cuantificable. Eso tiene gran importancia, porque es la evolución de esta subjetividad que tiene la entrevista clínica, que depende del criterio del médico”.

Por ello, los investigadores señalan que como la esquizofrenia comienza sus manifestaciones clínicas en la adolescencia, “la intervención temprana cobra aún más valor. La psiquiatría busca anticiparse a los escenarios clínicos en los casos complejos; en este caso, pesquisando estos patrones, que no son comprobables a simple vista, pero que con herramientas de este tipo es más fácil”. La profesora Figueroa añade que “dada la carencia de especialistas de salud mental en todo Chile y más aún en zonas remotas, muchas veces los profesionales de atención primaria son los que pesquisan estos casos. Si hubiese la posibilidad de desarrollar una herramienta simple, como una aplicación de celular basada en estos avances, un instrumento que capture los elementos preeminentes del lenguaje y que le diera al médico alguna indicación más certera para derivar al paciente con sospecha a una interconsulta, eso sería muy deseable y un resultado muy realista de este trabajo. Sería un salto cuántico respecto de lo que hay ahora, porque mostramos que el análisis del lenguaje tiene el potencial de ser utilizado como herramienta de detección de diagnóstico psiquiátrico. Gracias al análisis del lenguaje, y a partir de una conversación, se ahorra un montón de intervenciones costosas para el paciente, en lo emocional y económico.

Por eso, finalizan añadiendo que “este trabajo es inédito porque la mayoría de los que se han publicado se ha realizado con angloparlantes; nosotros, en cambio, probamos que no se pueden generalizar los algoritmos de búsqueda y clasificación per se, ya que es necesario elaborar modelos ajustados a la lengua de los informantes”.