Using Text Classification to Estimate the Depression Level of Reddit Users

Autores
Burdisso, Sergio G.; Errecalde, Marcelo Luis; Montes y Gómez, Manuel
Año de publicación
2021
Idioma
inglés
Tipo de recurso
artículo
Estado
versión publicada
Descripción
Psychologists have used tests and carefully designed survey questions, such as Beck’s Depression Inventory (BDI), to identify the presence of depression and to assess its severity level. On the other hand, methods for automatic depression detection have gained increasing interest since all the information available in social media, such as Twitter and Facebook, enables novel approaches based on language use. More precisely, these methods have focused on learning to detect depressive users through their language usage. However, little effort has been put into going beyond mere detection, towards estimating users’ actual clinical depression level. The present study is a first step towards that direction: we try to develop a model able to estimate Reddit’s users’ clinical depression level by filling in the BDI depression questionnaire on behalf of each user. To carry out his task, the model answers all 21 questions of the questionnaire using the confidence value outputted by a binary text classifier trained to detect depressed users on Reddit. Our proposal was publicly tested in the CLEF’s eRisk 2019 lab obtaining the best and second-best performance among the other 13 submitted models.
Los psicólogos han utilizado cuestionarios cuidadosamente diseñadas, como el “Inventario de Depresión de Beck” (BDI), para identificar la presencia de depresión y evaluar su grado de severidad. Por otro lado, los métodos para automáticamente detectar depresión están ganando un creciente interés debido a la gran cantidad de información disponible en las redes sociales. Mas precisamente, estos métodos se han centrado en aprender a detectar usuarios depresivos a través de su uso del lenguaje. Sin embargo, poco esfuerzo se ha realizado en ir mas allá de la mera detección, hacia la estimación del nivel de depresión clínica real de los usuarios. El presente estudio es un primer paso hacia esa dirección, en donde intentamos desarrollar un modelo capaz de estimar el nivel de depresión clínica de usuarios de Reddit completando el cuestionario de depresión BDI por cada uno de ellos. Para llevar a cabo su tarea, el modelo responde las 21 preguntas del cuestionario utilizando el valor de confianza emitido por un clasificador de texto binario entrenado para detectar usuarios depresivos en Reddit. Nuestra propuesta fue probada públicamente en el eRisk 2019 obteniendo el mejor, y segundo mejor, desempeño entre los otros 13 modelos presentados.
Facultad de Informática
Materia
Ciencias Informáticas
Beck’s Depression Inventory
Clasificación de textos,
CLEF eRisk 2019
Depression Level Estimation
Estimación del nivel de depresión
SS3
Text Classification
Inventario de Depresión de Beck
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/118067

id SEDICI_b0278c11705da5a9f135809a7a77ee17
oai_identifier_str oai:sedici.unlp.edu.ar:10915/118067
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Using Text Classification to Estimate the Depression Level of Reddit UsersUsando Clasificación de Textos para Estimar el Nivel de Depresión de Usuarios de RedditBurdisso, Sergio G.Errecalde, Marcelo LuisMontes y Gómez, ManuelCiencias InformáticasBeck’s Depression InventoryClasificación de textos,CLEF eRisk 2019Depression Level EstimationEstimación del nivel de depresiónSS3Text ClassificationInventario de Depresión de BeckPsychologists have used tests and carefully designed survey questions, such as Beck’s Depression Inventory (BDI), to identify the presence of depression and to assess its severity level. On the other hand, methods for automatic depression detection have gained increasing interest since all the information available in social media, such as Twitter and Facebook, enables novel approaches based on language use. More precisely, these methods have focused on learning to detect depressive users through their language usage. However, little effort has been put into going beyond mere detection, towards estimating users’ actual clinical depression level. The present study is a first step towards that direction: we try to develop a model able to estimate Reddit’s users’ clinical depression level by filling in the BDI depression questionnaire on behalf of each user. To carry out his task, the model answers all 21 questions of the questionnaire using the confidence value outputted by a binary text classifier trained to detect depressed users on Reddit. Our proposal was publicly tested in the CLEF’s eRisk 2019 lab obtaining the best and second-best performance among the other 13 submitted models.Los psicólogos han utilizado cuestionarios cuidadosamente diseñadas, como el “Inventario de Depresión de Beck” (BDI), para identificar la presencia de depresión y evaluar su grado de severidad. Por otro lado, los métodos para automáticamente detectar depresión están ganando un creciente interés debido a la gran cantidad de información disponible en las redes sociales. Mas precisamente, estos métodos se han centrado en aprender a detectar usuarios depresivos a través de su uso del lenguaje. Sin embargo, poco esfuerzo se ha realizado en ir mas allá de la mera detección, hacia la estimación del nivel de depresión clínica real de los usuarios. El presente estudio es un primer paso hacia esa dirección, en donde intentamos desarrollar un modelo capaz de estimar el nivel de depresión clínica de usuarios de Reddit completando el cuestionario de depresión BDI por cada uno de ellos. Para llevar a cabo su tarea, el modelo responde las 21 preguntas del cuestionario utilizando el valor de confianza emitido por un clasificador de texto binario entrenado para detectar usuarios depresivos en Reddit. Nuestra propuesta fue probada públicamente en el eRisk 2019 obteniendo el mejor, y segundo mejor, desempeño entre los otros 13 modelos presentados.Facultad de Informática2021-04-17info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionArticulohttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/118067enginfo:eu-repo/semantics/altIdentifier/url/https://journal.info.unlp.edu.ar/JCST/article/view/1352info:eu-repo/semantics/altIdentifier/issn/1666-6038info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc/4.0/Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T11:27:44Zoai:sedici.unlp.edu.ar:10915/118067Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 11:27:45.069SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Using Text Classification to Estimate the Depression Level of Reddit Users
Usando Clasificación de Textos para Estimar el Nivel de Depresión de Usuarios de Reddit
title Using Text Classification to Estimate the Depression Level of Reddit Users
spellingShingle Using Text Classification to Estimate the Depression Level of Reddit Users
Burdisso, Sergio G.
Ciencias Informáticas
Beck’s Depression Inventory
Clasificación de textos,
CLEF eRisk 2019
Depression Level Estimation
Estimación del nivel de depresión
SS3
Text Classification
Inventario de Depresión de Beck
title_short Using Text Classification to Estimate the Depression Level of Reddit Users
title_full Using Text Classification to Estimate the Depression Level of Reddit Users
title_fullStr Using Text Classification to Estimate the Depression Level of Reddit Users
title_full_unstemmed Using Text Classification to Estimate the Depression Level of Reddit Users
title_sort Using Text Classification to Estimate the Depression Level of Reddit Users
dc.creator.none.fl_str_mv Burdisso, Sergio G.
Errecalde, Marcelo Luis
Montes y Gómez, Manuel
author Burdisso, Sergio G.
author_facet Burdisso, Sergio G.
Errecalde, Marcelo Luis
Montes y Gómez, Manuel
author_role author
author2 Errecalde, Marcelo Luis
Montes y Gómez, Manuel
author2_role author
author
dc.subject.none.fl_str_mv Ciencias Informáticas
Beck’s Depression Inventory
Clasificación de textos,
CLEF eRisk 2019
Depression Level Estimation
Estimación del nivel de depresión
SS3
Text Classification
Inventario de Depresión de Beck
topic Ciencias Informáticas
Beck’s Depression Inventory
Clasificación de textos,
CLEF eRisk 2019
Depression Level Estimation
Estimación del nivel de depresión
SS3
Text Classification
Inventario de Depresión de Beck
dc.description.none.fl_txt_mv Psychologists have used tests and carefully designed survey questions, such as Beck’s Depression Inventory (BDI), to identify the presence of depression and to assess its severity level. On the other hand, methods for automatic depression detection have gained increasing interest since all the information available in social media, such as Twitter and Facebook, enables novel approaches based on language use. More precisely, these methods have focused on learning to detect depressive users through their language usage. However, little effort has been put into going beyond mere detection, towards estimating users’ actual clinical depression level. The present study is a first step towards that direction: we try to develop a model able to estimate Reddit’s users’ clinical depression level by filling in the BDI depression questionnaire on behalf of each user. To carry out his task, the model answers all 21 questions of the questionnaire using the confidence value outputted by a binary text classifier trained to detect depressed users on Reddit. Our proposal was publicly tested in the CLEF’s eRisk 2019 lab obtaining the best and second-best performance among the other 13 submitted models.
Los psicólogos han utilizado cuestionarios cuidadosamente diseñadas, como el “Inventario de Depresión de Beck” (BDI), para identificar la presencia de depresión y evaluar su grado de severidad. Por otro lado, los métodos para automáticamente detectar depresión están ganando un creciente interés debido a la gran cantidad de información disponible en las redes sociales. Mas precisamente, estos métodos se han centrado en aprender a detectar usuarios depresivos a través de su uso del lenguaje. Sin embargo, poco esfuerzo se ha realizado en ir mas allá de la mera detección, hacia la estimación del nivel de depresión clínica real de los usuarios. El presente estudio es un primer paso hacia esa dirección, en donde intentamos desarrollar un modelo capaz de estimar el nivel de depresión clínica de usuarios de Reddit completando el cuestionario de depresión BDI por cada uno de ellos. Para llevar a cabo su tarea, el modelo responde las 21 preguntas del cuestionario utilizando el valor de confianza emitido por un clasificador de texto binario entrenado para detectar usuarios depresivos en Reddit. Nuestra propuesta fue probada públicamente en el eRisk 2019 obteniendo el mejor, y segundo mejor, desempeño entre los otros 13 modelos presentados.
Facultad de Informática
description Psychologists have used tests and carefully designed survey questions, such as Beck’s Depression Inventory (BDI), to identify the presence of depression and to assess its severity level. On the other hand, methods for automatic depression detection have gained increasing interest since all the information available in social media, such as Twitter and Facebook, enables novel approaches based on language use. More precisely, these methods have focused on learning to detect depressive users through their language usage. However, little effort has been put into going beyond mere detection, towards estimating users’ actual clinical depression level. The present study is a first step towards that direction: we try to develop a model able to estimate Reddit’s users’ clinical depression level by filling in the BDI depression questionnaire on behalf of each user. To carry out his task, the model answers all 21 questions of the questionnaire using the confidence value outputted by a binary text classifier trained to detect depressed users on Reddit. Our proposal was publicly tested in the CLEF’s eRisk 2019 lab obtaining the best and second-best performance among the other 13 submitted models.
publishDate 2021
dc.date.none.fl_str_mv 2021-04-17
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Articulo
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/118067
url http://sedici.unlp.edu.ar/handle/10915/118067
dc.language.none.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/https://journal.info.unlp.edu.ar/JCST/article/view/1352
info:eu-repo/semantics/altIdentifier/issn/1666-6038
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc/4.0/
Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc/4.0/
Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1844616155650588672
score 13.069144