Cognitive phenotyping of Parkinson’s disease patients via digital analysis of spoken word properties
Ferrante, F., Escobar Grisales, D., López, M. F., Lopes da Cunha, P., Sterpin, L., Vonk, J., Chaná Cuevas, P., Estienne, C., Hesse, E., Amoruso, L., Orozco Arroyave, J. R. & García, A. M. (2025). Cognitive phenotyping of Parkinson’s disease patients via digital analysis of spoken word properties. Movement Disorders 40(11), 2354-2366.
Introducción: Los síntomas cognitivos son muy frecuentes en la enfermedad de Parkinson (EP) y suelen manifestarse como deterioro cognitivo leve (DCL). Sin embargo, su detección y caracterización siguen siendo insuficientes, ya que los enfoques estándar se basan en impresiones subjetivas derivadas de pruebas univariantes prolongadas.
Objetivo: Examinamos si el análisis digital de la fluidez verbal predice el estado cognitivo en la EP.
Métodos: Pedimos a 464 hispanohablantes con EP que completaran tareas de fluidez taxonómica (animales), temática (supermercado) y fonémica (/p/). Cuantificamos seis propiedades de respuesta: variabilidad semántica, granularidad, concreción, longitud, frecuencia y vecindad fonológica. En el estudio 1, estas propiedades se introdujeron en un regresor ridge para predecir las puntuaciones y subpuntuaciones de la Escala de Evaluación de la Demencia de Mattis (MDRS). En el estudio 2, utilizamos las mismas propiedades para comparar (mediante un modelo lineal generalizado) y clasificar (mediante un bosque aleatorio) a 123 pacientes con DCL y 124 sin DCL.
Resultados: En el estudio 1, las puntuaciones y subpuntuaciones MDRS previstas se correlacionaron fuertemente con las reales, ajustadas por variables clínicas y cognitivas (R = 0,51, P < 0,001). En el estudio 2, las palabras de los pacientes con DCL eran menos variables semánticamente, menos concretas y más cortas, ajustadas por variables clínicas y cognitivas (valores P < 0,05). La discriminación mediante aprendizaje automático entre pacientes con y sin DCL fue sólida en el conjunto de validación (área bajo la curva [AUC] = 0,76), con una buena generalización a muestras no vistas prequirúrgicas (AUC = 0,68) y posquirúrgicas (AUC = 0,72), superando las puntuaciones MDRS (AUC = 0,54). Los resultados se vieron impulsados de forma consistente por la variabilidad semántica, la granularidad y la concreción.
Conclusiones: El análisis de las propiedades de las palabras digitales predice la gravedad de los síntomas cognitivos y distingue entre los fenotipos cognitivos de la EP, lo que permite realizar evaluaciones neuropsicológicas escalables. © 2025 International Parkinson and Movement Disorder Society.
Para acceder al artículo, hacé click aquí.
Cognitive phenotyping of Parkinson’s disease patients via digital analysis of spoken word properties
Ferrante, F., Escobar Grisales, D., López, M. F., Lopes da Cunha, P., Sterpin, L., Vonk, J., Chaná Cuevas, P., Estienne, C., Hesse, E., Amoruso, L., Orozco Arroyave, J. R. & García, A. M. (2025). Cognitive phenotyping of Parkinson’s disease patients via digital analysis of spoken word properties. Movement Disorders 40(11), 2354-2366.
Background: Cognitive symptoms are highly prevalent in Parkinson’s disease (PD), often manifesting as mild cognitive impairment (MCI). Yet, their detection and characterization remain suboptimal because standard approaches rely on subjective impressions derived from lengthy, univariate tests.
Objective: We examined whether digital analysis of verbal fluency predicts cognitive status in PD.
Methods: We asked 464 Spanish speakers with PD to complete taxonomic (animal), thematic (supermarket), and phonemic (/p/) fluency tasks. We quantified six response properties: semantic variability, granularity, concreteness, length, frequency, and phonological neighborhood. In Study 1, these properties were fed to a ridge regressor to predict Mattis Dementia Rating Scale (MDRS) scores and subscores. In Study 2, we used the same properties to compare (via a generalized linear model) and classify (via random forest) between 123 patients with and 124 without MCI.
Results: In Study 1, predicted MDRS scores and subscores strongly correlated with actual ones, adjusting for clinical and cognitive variables (R = 0.51, P < 0.001). In Study 2, MCI patients’ words were less semantically variable, less concrete, and shorter, adjusting for clinical and cognitive variables (P-values < 0.05). Machine learning discrimination between patients with and without MCI was robust in the validation set (area under the curve [AUC] = 0.76), with good generalization to unseen pre-surgical (AUC = 0.68) and post-surgical (AUC = 0.72) samples, surpassing MDRS scores (AUC = 0.54). Results were consistently driven by semantic variability, granularity, and concreteness.
Conclusions: Digital word property analysis predicts cognitive symptom severity and distinguishes between cognitive phenotypes of PD, enabling scalable neuropsychological screenings. © 2025 International Parkinson and Movement Disorder Society.
To access the full paper, please click here.



