Using Text Classification to Estimate the Depression Level of Reddit Users
- Autores
- Burdisso, Sergio G.; Errecalde, Marcelo Luis; Montes y Gómez, Manuel
- Año de publicación
- 2021
- Idioma
- inglés
- Tipo de recurso
- artículo
- Estado
- versión publicada
- Descripción
- Psychologists have used tests and carefully designed survey questions, such as Beck’s Depression Inventory (BDI), to identify the presence of depression and to assess its severity level. On the other hand, methods for automatic depression detection have gained increasing interest since all the information available in social media, such as Twitter and Facebook, enables novel approaches based on language use. More precisely, these methods have focused on learning to detect depressive users through their language usage. However, little effort has been put into going beyond mere detection, towards estimating users’ actual clinical depression level. The present study is a first step towards that direction: we try to develop a model able to estimate Reddit’s users’ clinical depression level by filling in the BDI depression questionnaire on behalf of each user. To carry out his task, the model answers all 21 questions of the questionnaire using the confidence value outputted by a binary text classifier trained to detect depressed users on Reddit. Our proposal was publicly tested in the CLEF’s eRisk 2019 lab obtaining the best and second-best performance among the other 13 submitted models.
Los psicólogos han utilizado cuestionarios cuidadosamente diseñadas, como el “Inventario de Depresión de Beck” (BDI), para identificar la presencia de depresión y evaluar su grado de severidad. Por otro lado, los métodos para automáticamente detectar depresión están ganando un creciente interés debido a la gran cantidad de información disponible en las redes sociales. Mas precisamente, estos métodos se han centrado en aprender a detectar usuarios depresivos a través de su uso del lenguaje. Sin embargo, poco esfuerzo se ha realizado en ir mas allá de la mera detección, hacia la estimación del nivel de depresión clínica real de los usuarios. El presente estudio es un primer paso hacia esa dirección, en donde intentamos desarrollar un modelo capaz de estimar el nivel de depresión clínica de usuarios de Reddit completando el cuestionario de depresión BDI por cada uno de ellos. Para llevar a cabo su tarea, el modelo responde las 21 preguntas del cuestionario utilizando el valor de confianza emitido por un clasificador de texto binario entrenado para detectar usuarios depresivos en Reddit. Nuestra propuesta fue probada públicamente en el eRisk 2019 obteniendo el mejor, y segundo mejor, desempeño entre los otros 13 modelos presentados.
Facultad de Informática - Materia
-
Ciencias Informáticas
Beck’s Depression Inventory
Clasificación de textos,
CLEF eRisk 2019
Depression Level Estimation
Estimación del nivel de depresión
SS3
Text Classification
Inventario de Depresión de Beck - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc/4.0/
- Repositorio
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/118067
Ver los metadatos del registro completo
id |
SEDICI_b0278c11705da5a9f135809a7a77ee17 |
---|---|
oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/118067 |
network_acronym_str |
SEDICI |
repository_id_str |
1329 |
network_name_str |
SEDICI (UNLP) |
spelling |
Using Text Classification to Estimate the Depression Level of Reddit UsersUsando Clasificación de Textos para Estimar el Nivel de Depresión de Usuarios de RedditBurdisso, Sergio G.Errecalde, Marcelo LuisMontes y Gómez, ManuelCiencias InformáticasBeck’s Depression InventoryClasificación de textos,CLEF eRisk 2019Depression Level EstimationEstimación del nivel de depresiónSS3Text ClassificationInventario de Depresión de BeckPsychologists have used tests and carefully designed survey questions, such as Beck’s Depression Inventory (BDI), to identify the presence of depression and to assess its severity level. On the other hand, methods for automatic depression detection have gained increasing interest since all the information available in social media, such as Twitter and Facebook, enables novel approaches based on language use. More precisely, these methods have focused on learning to detect depressive users through their language usage. However, little effort has been put into going beyond mere detection, towards estimating users’ actual clinical depression level. The present study is a first step towards that direction: we try to develop a model able to estimate Reddit’s users’ clinical depression level by filling in the BDI depression questionnaire on behalf of each user. To carry out his task, the model answers all 21 questions of the questionnaire using the confidence value outputted by a binary text classifier trained to detect depressed users on Reddit. Our proposal was publicly tested in the CLEF’s eRisk 2019 lab obtaining the best and second-best performance among the other 13 submitted models.Los psicólogos han utilizado cuestionarios cuidadosamente diseñadas, como el “Inventario de Depresión de Beck” (BDI), para identificar la presencia de depresión y evaluar su grado de severidad. Por otro lado, los métodos para automáticamente detectar depresión están ganando un creciente interés debido a la gran cantidad de información disponible en las redes sociales. Mas precisamente, estos métodos se han centrado en aprender a detectar usuarios depresivos a través de su uso del lenguaje. Sin embargo, poco esfuerzo se ha realizado en ir mas allá de la mera detección, hacia la estimación del nivel de depresión clínica real de los usuarios. El presente estudio es un primer paso hacia esa dirección, en donde intentamos desarrollar un modelo capaz de estimar el nivel de depresión clínica de usuarios de Reddit completando el cuestionario de depresión BDI por cada uno de ellos. Para llevar a cabo su tarea, el modelo responde las 21 preguntas del cuestionario utilizando el valor de confianza emitido por un clasificador de texto binario entrenado para detectar usuarios depresivos en Reddit. Nuestra propuesta fue probada públicamente en el eRisk 2019 obteniendo el mejor, y segundo mejor, desempeño entre los otros 13 modelos presentados.Facultad de Informática2021-04-17info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionArticulohttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/118067enginfo:eu-repo/semantics/altIdentifier/url/https://journal.info.unlp.edu.ar/JCST/article/view/1352info:eu-repo/semantics/altIdentifier/issn/1666-6038info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc/4.0/Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T11:27:44Zoai:sedici.unlp.edu.ar:10915/118067Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 11:27:45.069SEDICI (UNLP) - Universidad Nacional de La Platafalse |
dc.title.none.fl_str_mv |
Using Text Classification to Estimate the Depression Level of Reddit Users Usando Clasificación de Textos para Estimar el Nivel de Depresión de Usuarios de Reddit |
title |
Using Text Classification to Estimate the Depression Level of Reddit Users |
spellingShingle |
Using Text Classification to Estimate the Depression Level of Reddit Users Burdisso, Sergio G. Ciencias Informáticas Beck’s Depression Inventory Clasificación de textos, CLEF eRisk 2019 Depression Level Estimation Estimación del nivel de depresión SS3 Text Classification Inventario de Depresión de Beck |
title_short |
Using Text Classification to Estimate the Depression Level of Reddit Users |
title_full |
Using Text Classification to Estimate the Depression Level of Reddit Users |
title_fullStr |
Using Text Classification to Estimate the Depression Level of Reddit Users |
title_full_unstemmed |
Using Text Classification to Estimate the Depression Level of Reddit Users |
title_sort |
Using Text Classification to Estimate the Depression Level of Reddit Users |
dc.creator.none.fl_str_mv |
Burdisso, Sergio G. Errecalde, Marcelo Luis Montes y Gómez, Manuel |
author |
Burdisso, Sergio G. |
author_facet |
Burdisso, Sergio G. Errecalde, Marcelo Luis Montes y Gómez, Manuel |
author_role |
author |
author2 |
Errecalde, Marcelo Luis Montes y Gómez, Manuel |
author2_role |
author author |
dc.subject.none.fl_str_mv |
Ciencias Informáticas Beck’s Depression Inventory Clasificación de textos, CLEF eRisk 2019 Depression Level Estimation Estimación del nivel de depresión SS3 Text Classification Inventario de Depresión de Beck |
topic |
Ciencias Informáticas Beck’s Depression Inventory Clasificación de textos, CLEF eRisk 2019 Depression Level Estimation Estimación del nivel de depresión SS3 Text Classification Inventario de Depresión de Beck |
dc.description.none.fl_txt_mv |
Psychologists have used tests and carefully designed survey questions, such as Beck’s Depression Inventory (BDI), to identify the presence of depression and to assess its severity level. On the other hand, methods for automatic depression detection have gained increasing interest since all the information available in social media, such as Twitter and Facebook, enables novel approaches based on language use. More precisely, these methods have focused on learning to detect depressive users through their language usage. However, little effort has been put into going beyond mere detection, towards estimating users’ actual clinical depression level. The present study is a first step towards that direction: we try to develop a model able to estimate Reddit’s users’ clinical depression level by filling in the BDI depression questionnaire on behalf of each user. To carry out his task, the model answers all 21 questions of the questionnaire using the confidence value outputted by a binary text classifier trained to detect depressed users on Reddit. Our proposal was publicly tested in the CLEF’s eRisk 2019 lab obtaining the best and second-best performance among the other 13 submitted models. Los psicólogos han utilizado cuestionarios cuidadosamente diseñadas, como el “Inventario de Depresión de Beck” (BDI), para identificar la presencia de depresión y evaluar su grado de severidad. Por otro lado, los métodos para automáticamente detectar depresión están ganando un creciente interés debido a la gran cantidad de información disponible en las redes sociales. Mas precisamente, estos métodos se han centrado en aprender a detectar usuarios depresivos a través de su uso del lenguaje. Sin embargo, poco esfuerzo se ha realizado en ir mas allá de la mera detección, hacia la estimación del nivel de depresión clínica real de los usuarios. El presente estudio es un primer paso hacia esa dirección, en donde intentamos desarrollar un modelo capaz de estimar el nivel de depresión clínica de usuarios de Reddit completando el cuestionario de depresión BDI por cada uno de ellos. Para llevar a cabo su tarea, el modelo responde las 21 preguntas del cuestionario utilizando el valor de confianza emitido por un clasificador de texto binario entrenado para detectar usuarios depresivos en Reddit. Nuestra propuesta fue probada públicamente en el eRisk 2019 obteniendo el mejor, y segundo mejor, desempeño entre los otros 13 modelos presentados. Facultad de Informática |
description |
Psychologists have used tests and carefully designed survey questions, such as Beck’s Depression Inventory (BDI), to identify the presence of depression and to assess its severity level. On the other hand, methods for automatic depression detection have gained increasing interest since all the information available in social media, such as Twitter and Facebook, enables novel approaches based on language use. More precisely, these methods have focused on learning to detect depressive users through their language usage. However, little effort has been put into going beyond mere detection, towards estimating users’ actual clinical depression level. The present study is a first step towards that direction: we try to develop a model able to estimate Reddit’s users’ clinical depression level by filling in the BDI depression questionnaire on behalf of each user. To carry out his task, the model answers all 21 questions of the questionnaire using the confidence value outputted by a binary text classifier trained to detect depressed users on Reddit. Our proposal was publicly tested in the CLEF’s eRisk 2019 lab obtaining the best and second-best performance among the other 13 submitted models. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-04-17 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Articulo http://purl.org/coar/resource_type/c_6501 info:ar-repo/semantics/articulo |
format |
article |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/118067 |
url |
http://sedici.unlp.edu.ar/handle/10915/118067 |
dc.language.none.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/url/https://journal.info.unlp.edu.ar/JCST/article/view/1352 info:eu-repo/semantics/altIdentifier/issn/1666-6038 |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc/4.0/ Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
reponame_str |
SEDICI (UNLP) |
collection |
SEDICI (UNLP) |
instname_str |
Universidad Nacional de La Plata |
instacron_str |
UNLP |
institution |
UNLP |
repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
_version_ |
1844616155650588672 |
score |
13.069144 |