Efectos de la categorización de estímulos en la reconstrucción semántica de lenguajes continuos a partir de señales fMRI

Autores
Delmagro, Nicolás Agustín
Año de publicación
2024
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Kamienkowski, Juan Esteban
Bianchi, Bruno
Descripción
En los últimos años han surgido algunos estudios en los que se analizan imágenes de resonancia magnética funcional (fMRI) mientras se efectúan ciertas tareas relacionadas a la comprensión del lenguaje natural. Siguiendo el éxito del estudio de la concordancia del sistema visual y los modelos de redes profundas, en estos trabajos se preguntan cuán similar es la representación del lenguaje en el cerebro respecto de los nuevos modelos de redes profundas. En particular, varios trabajos se han basado en el dataset liberado por LeBel, Huth y colaboradores (“A natural fMRI dataset for encoding models” [LeBel et al., 2023]), donde se capturaron estas respuestas cerebrales mientras los participantes escuchaban relatos autobiográficos de los podcasts The Moth y Modern Love. Haciendo uso de estos datos, han realizado un mapeo semántico de distintas áreas del cerebro e incluso llegando a la generación de decoders para poder reconstruir semánticamente estas historias a partir de dichas señales cerebrales [Tang et al., 2023]. En esta línea, en la presente tesis, nos preguntamos cuáles pueden ser los efectos de introducir sesgos temáticos en los estímulos utilizados para entrenar los modelos, y si el desempeño mejora al intentar decodificar un estímulo cuyo tema coincide con el del entrenamiento. Para ello, consideramos que aquellas historias con temáticas similares deberían tener ciertas similitudes en el vocabulario utilizado. En primer lugar, buscamos agrupar estas narraciones por el tema principal que tratan, logrando separarlas en dos grupos. Luego, estos subconjuntos fueron utilizados como entrenamiento comparando los efectos que tiene en las reconstrucciones semánticas generadas el hecho de entrenar y evaluar con distintos subconjuntos.
In recent years, many studies have emerged in which Functional Magnetic Resonance Imaging (fMRI) are analyzed while carrying out certain tasks related to the understanding of natural language. Following the success with the study of the concordance between the visual system and deep network models, these works ask how similar the representation of language in the brain is with respect to the new deep network models. In particular, several works have been based on the dataset released by LeBel, Huth and collaborators (“A natural fMRI dataset for encoding models” [LeBel et al., 2023]), where these brain responses were captured while participants listened to autobiographical narrations from the podcasts The Moth and Modern Love. Using this data, they have carried out a semantic mapping of different areas of the brain and even gone so far as to generate decoders to be able to semantically reconstruct these stories from the brain signals [Tang et al., 2023]. Following this line, in this thesis, we ask what the effects of introducing thematic biases in the stimuli used to train the models may be, and whether performance improves when trying to decode a stimulus whose theme matches the one used as training. To do this, we consider that those stories with similar themes should have certain similarities in the vocabulary they use. Firstly, we seek to group these narratives by the main theme they talk about, managing to separate them into two groups. Then, these subsets were used as training, comparing the effects that training and evaluating with different subsets has on the semantic reconstructions generated.
Fil: Delmagro, Nicolás Agustín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
fMRI
LENGUAJE
MODELO DE LENGUAJE
CEREBRO
ENCODER
DECODER
AUDIOS
MAPEO SEMANTICO
fMRI
LANGUAGE
LANGUAGE MODEL
BRAIN
ENCODER
DECODER
AUDIOS
SEMANTIC MAPPING
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
seminario:seminario_nCOM000825_Delmagro

id BDUBAFCEN_9ff74d5466ac1ff2657d5f7a2bccec6e
oai_identifier_str seminario:seminario_nCOM000825_Delmagro
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Efectos de la categorización de estímulos en la reconstrucción semántica de lenguajes continuos a partir de señales fMRIEffects of stimulus categorization on semantic reconstruction of continuous languages from fMRI signalsDelmagro, Nicolás AgustínfMRILENGUAJEMODELO DE LENGUAJECEREBROENCODERDECODERAUDIOSMAPEO SEMANTICOfMRILANGUAGELANGUAGE MODELBRAINENCODERDECODERAUDIOSSEMANTIC MAPPINGEn los últimos años han surgido algunos estudios en los que se analizan imágenes de resonancia magnética funcional (fMRI) mientras se efectúan ciertas tareas relacionadas a la comprensión del lenguaje natural. Siguiendo el éxito del estudio de la concordancia del sistema visual y los modelos de redes profundas, en estos trabajos se preguntan cuán similar es la representación del lenguaje en el cerebro respecto de los nuevos modelos de redes profundas. En particular, varios trabajos se han basado en el dataset liberado por LeBel, Huth y colaboradores (“A natural fMRI dataset for encoding models” [LeBel et al., 2023]), donde se capturaron estas respuestas cerebrales mientras los participantes escuchaban relatos autobiográficos de los podcasts The Moth y Modern Love. Haciendo uso de estos datos, han realizado un mapeo semántico de distintas áreas del cerebro e incluso llegando a la generación de decoders para poder reconstruir semánticamente estas historias a partir de dichas señales cerebrales [Tang et al., 2023]. En esta línea, en la presente tesis, nos preguntamos cuáles pueden ser los efectos de introducir sesgos temáticos en los estímulos utilizados para entrenar los modelos, y si el desempeño mejora al intentar decodificar un estímulo cuyo tema coincide con el del entrenamiento. Para ello, consideramos que aquellas historias con temáticas similares deberían tener ciertas similitudes en el vocabulario utilizado. En primer lugar, buscamos agrupar estas narraciones por el tema principal que tratan, logrando separarlas en dos grupos. Luego, estos subconjuntos fueron utilizados como entrenamiento comparando los efectos que tiene en las reconstrucciones semánticas generadas el hecho de entrenar y evaluar con distintos subconjuntos.In recent years, many studies have emerged in which Functional Magnetic Resonance Imaging (fMRI) are analyzed while carrying out certain tasks related to the understanding of natural language. Following the success with the study of the concordance between the visual system and deep network models, these works ask how similar the representation of language in the brain is with respect to the new deep network models. In particular, several works have been based on the dataset released by LeBel, Huth and collaborators (“A natural fMRI dataset for encoding models” [LeBel et al., 2023]), where these brain responses were captured while participants listened to autobiographical narrations from the podcasts The Moth and Modern Love. Using this data, they have carried out a semantic mapping of different areas of the brain and even gone so far as to generate decoders to be able to semantically reconstruct these stories from the brain signals [Tang et al., 2023]. Following this line, in this thesis, we ask what the effects of introducing thematic biases in the stimuli used to train the models may be, and whether performance improves when trying to decode a stimulus whose theme matches the one used as training. To do this, we consider that those stories with similar themes should have certain similarities in the vocabulary they use. Firstly, we seek to group these narratives by the main theme they talk about, managing to separate them into two groups. Then, these subsets were used as training, comparing the effects that training and evaluating with different subsets has on the semantic reconstructions generated.Fil: Delmagro, Nicolás Agustín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesKamienkowski, Juan EstebanBianchi, Bruno2024-12-20info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000825_Delmagrospainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:43:35Zseminario:seminario_nCOM000825_DelmagroInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:43:36.165Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Efectos de la categorización de estímulos en la reconstrucción semántica de lenguajes continuos a partir de señales fMRI
Effects of stimulus categorization on semantic reconstruction of continuous languages from fMRI signals
title Efectos de la categorización de estímulos en la reconstrucción semántica de lenguajes continuos a partir de señales fMRI
spellingShingle Efectos de la categorización de estímulos en la reconstrucción semántica de lenguajes continuos a partir de señales fMRI
Delmagro, Nicolás Agustín
fMRI
LENGUAJE
MODELO DE LENGUAJE
CEREBRO
ENCODER
DECODER
AUDIOS
MAPEO SEMANTICO
fMRI
LANGUAGE
LANGUAGE MODEL
BRAIN
ENCODER
DECODER
AUDIOS
SEMANTIC MAPPING
title_short Efectos de la categorización de estímulos en la reconstrucción semántica de lenguajes continuos a partir de señales fMRI
title_full Efectos de la categorización de estímulos en la reconstrucción semántica de lenguajes continuos a partir de señales fMRI
title_fullStr Efectos de la categorización de estímulos en la reconstrucción semántica de lenguajes continuos a partir de señales fMRI
title_full_unstemmed Efectos de la categorización de estímulos en la reconstrucción semántica de lenguajes continuos a partir de señales fMRI
title_sort Efectos de la categorización de estímulos en la reconstrucción semántica de lenguajes continuos a partir de señales fMRI
dc.creator.none.fl_str_mv Delmagro, Nicolás Agustín
author Delmagro, Nicolás Agustín
author_facet Delmagro, Nicolás Agustín
author_role author
dc.contributor.none.fl_str_mv Kamienkowski, Juan Esteban
Bianchi, Bruno
dc.subject.none.fl_str_mv fMRI
LENGUAJE
MODELO DE LENGUAJE
CEREBRO
ENCODER
DECODER
AUDIOS
MAPEO SEMANTICO
fMRI
LANGUAGE
LANGUAGE MODEL
BRAIN
ENCODER
DECODER
AUDIOS
SEMANTIC MAPPING
topic fMRI
LENGUAJE
MODELO DE LENGUAJE
CEREBRO
ENCODER
DECODER
AUDIOS
MAPEO SEMANTICO
fMRI
LANGUAGE
LANGUAGE MODEL
BRAIN
ENCODER
DECODER
AUDIOS
SEMANTIC MAPPING
dc.description.none.fl_txt_mv En los últimos años han surgido algunos estudios en los que se analizan imágenes de resonancia magnética funcional (fMRI) mientras se efectúan ciertas tareas relacionadas a la comprensión del lenguaje natural. Siguiendo el éxito del estudio de la concordancia del sistema visual y los modelos de redes profundas, en estos trabajos se preguntan cuán similar es la representación del lenguaje en el cerebro respecto de los nuevos modelos de redes profundas. En particular, varios trabajos se han basado en el dataset liberado por LeBel, Huth y colaboradores (“A natural fMRI dataset for encoding models” [LeBel et al., 2023]), donde se capturaron estas respuestas cerebrales mientras los participantes escuchaban relatos autobiográficos de los podcasts The Moth y Modern Love. Haciendo uso de estos datos, han realizado un mapeo semántico de distintas áreas del cerebro e incluso llegando a la generación de decoders para poder reconstruir semánticamente estas historias a partir de dichas señales cerebrales [Tang et al., 2023]. En esta línea, en la presente tesis, nos preguntamos cuáles pueden ser los efectos de introducir sesgos temáticos en los estímulos utilizados para entrenar los modelos, y si el desempeño mejora al intentar decodificar un estímulo cuyo tema coincide con el del entrenamiento. Para ello, consideramos que aquellas historias con temáticas similares deberían tener ciertas similitudes en el vocabulario utilizado. En primer lugar, buscamos agrupar estas narraciones por el tema principal que tratan, logrando separarlas en dos grupos. Luego, estos subconjuntos fueron utilizados como entrenamiento comparando los efectos que tiene en las reconstrucciones semánticas generadas el hecho de entrenar y evaluar con distintos subconjuntos.
In recent years, many studies have emerged in which Functional Magnetic Resonance Imaging (fMRI) are analyzed while carrying out certain tasks related to the understanding of natural language. Following the success with the study of the concordance between the visual system and deep network models, these works ask how similar the representation of language in the brain is with respect to the new deep network models. In particular, several works have been based on the dataset released by LeBel, Huth and collaborators (“A natural fMRI dataset for encoding models” [LeBel et al., 2023]), where these brain responses were captured while participants listened to autobiographical narrations from the podcasts The Moth and Modern Love. Using this data, they have carried out a semantic mapping of different areas of the brain and even gone so far as to generate decoders to be able to semantically reconstruct these stories from the brain signals [Tang et al., 2023]. Following this line, in this thesis, we ask what the effects of introducing thematic biases in the stimuli used to train the models may be, and whether performance improves when trying to decode a stimulus whose theme matches the one used as training. To do this, we consider that those stories with similar themes should have certain similarities in the vocabulary they use. Firstly, we seek to group these narratives by the main theme they talk about, managing to separate them into two groups. Then, these subsets were used as training, comparing the effects that training and evaluating with different subsets has on the semantic reconstructions generated.
Fil: Delmagro, Nicolás Agustín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description En los últimos años han surgido algunos estudios en los que se analizan imágenes de resonancia magnética funcional (fMRI) mientras se efectúan ciertas tareas relacionadas a la comprensión del lenguaje natural. Siguiendo el éxito del estudio de la concordancia del sistema visual y los modelos de redes profundas, en estos trabajos se preguntan cuán similar es la representación del lenguaje en el cerebro respecto de los nuevos modelos de redes profundas. En particular, varios trabajos se han basado en el dataset liberado por LeBel, Huth y colaboradores (“A natural fMRI dataset for encoding models” [LeBel et al., 2023]), donde se capturaron estas respuestas cerebrales mientras los participantes escuchaban relatos autobiográficos de los podcasts The Moth y Modern Love. Haciendo uso de estos datos, han realizado un mapeo semántico de distintas áreas del cerebro e incluso llegando a la generación de decoders para poder reconstruir semánticamente estas historias a partir de dichas señales cerebrales [Tang et al., 2023]. En esta línea, en la presente tesis, nos preguntamos cuáles pueden ser los efectos de introducir sesgos temáticos en los estímulos utilizados para entrenar los modelos, y si el desempeño mejora al intentar decodificar un estímulo cuyo tema coincide con el del entrenamiento. Para ello, consideramos que aquellas historias con temáticas similares deberían tener ciertas similitudes en el vocabulario utilizado. En primer lugar, buscamos agrupar estas narraciones por el tema principal que tratan, logrando separarlas en dos grupos. Luego, estos subconjuntos fueron utilizados como entrenamiento comparando los efectos que tiene en las reconstrucciones semánticas generadas el hecho de entrenar y evaluar con distintos subconjuntos.
publishDate 2024
dc.date.none.fl_str_mv 2024-12-20
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/seminario_nCOM000825_Delmagro
url https://hdl.handle.net/20.500.12110/seminario_nCOM000825_Delmagro
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1844618754820931584
score 13.070432