Efectos de la categorización de estímulos en la reconstrucción semántica de lenguajes continuos a partir de señales fMRI
- Autores
- Delmagro, Nicolás Agustín
- Año de publicación
- 2024
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Kamienkowski, Juan Esteban
Bianchi, Bruno - Descripción
- En los últimos años han surgido algunos estudios en los que se analizan imágenes de resonancia magnética funcional (fMRI) mientras se efectúan ciertas tareas relacionadas a la comprensión del lenguaje natural. Siguiendo el éxito del estudio de la concordancia del sistema visual y los modelos de redes profundas, en estos trabajos se preguntan cuán similar es la representación del lenguaje en el cerebro respecto de los nuevos modelos de redes profundas. En particular, varios trabajos se han basado en el dataset liberado por LeBel, Huth y colaboradores (“A natural fMRI dataset for encoding models” [LeBel et al., 2023]), donde se capturaron estas respuestas cerebrales mientras los participantes escuchaban relatos autobiográficos de los podcasts The Moth y Modern Love. Haciendo uso de estos datos, han realizado un mapeo semántico de distintas áreas del cerebro e incluso llegando a la generación de decoders para poder reconstruir semánticamente estas historias a partir de dichas señales cerebrales [Tang et al., 2023]. En esta línea, en la presente tesis, nos preguntamos cuáles pueden ser los efectos de introducir sesgos temáticos en los estímulos utilizados para entrenar los modelos, y si el desempeño mejora al intentar decodificar un estímulo cuyo tema coincide con el del entrenamiento. Para ello, consideramos que aquellas historias con temáticas similares deberían tener ciertas similitudes en el vocabulario utilizado. En primer lugar, buscamos agrupar estas narraciones por el tema principal que tratan, logrando separarlas en dos grupos. Luego, estos subconjuntos fueron utilizados como entrenamiento comparando los efectos que tiene en las reconstrucciones semánticas generadas el hecho de entrenar y evaluar con distintos subconjuntos.
In recent years, many studies have emerged in which Functional Magnetic Resonance Imaging (fMRI) are analyzed while carrying out certain tasks related to the understanding of natural language. Following the success with the study of the concordance between the visual system and deep network models, these works ask how similar the representation of language in the brain is with respect to the new deep network models. In particular, several works have been based on the dataset released by LeBel, Huth and collaborators (“A natural fMRI dataset for encoding models” [LeBel et al., 2023]), where these brain responses were captured while participants listened to autobiographical narrations from the podcasts The Moth and Modern Love. Using this data, they have carried out a semantic mapping of different areas of the brain and even gone so far as to generate decoders to be able to semantically reconstruct these stories from the brain signals [Tang et al., 2023]. Following this line, in this thesis, we ask what the effects of introducing thematic biases in the stimuli used to train the models may be, and whether performance improves when trying to decode a stimulus whose theme matches the one used as training. To do this, we consider that those stories with similar themes should have certain similarities in the vocabulary they use. Firstly, we seek to group these narratives by the main theme they talk about, managing to separate them into two groups. Then, these subsets were used as training, comparing the effects that training and evaluating with different subsets has on the semantic reconstructions generated.
Fil: Delmagro, Nicolás Agustín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. - Materia
-
fMRI
LENGUAJE
MODELO DE LENGUAJE
CEREBRO
ENCODER
DECODER
AUDIOS
MAPEO SEMANTICO
fMRI
LANGUAGE
LANGUAGE MODEL
BRAIN
ENCODER
DECODER
AUDIOS
SEMANTIC MAPPING - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar
- Repositorio
- Institución
- Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
- OAI Identificador
- seminario:seminario_nCOM000825_Delmagro
Ver los metadatos del registro completo
id |
BDUBAFCEN_9ff74d5466ac1ff2657d5f7a2bccec6e |
---|---|
oai_identifier_str |
seminario:seminario_nCOM000825_Delmagro |
network_acronym_str |
BDUBAFCEN |
repository_id_str |
1896 |
network_name_str |
Biblioteca Digital (UBA-FCEN) |
spelling |
Efectos de la categorización de estímulos en la reconstrucción semántica de lenguajes continuos a partir de señales fMRIEffects of stimulus categorization on semantic reconstruction of continuous languages from fMRI signalsDelmagro, Nicolás AgustínfMRILENGUAJEMODELO DE LENGUAJECEREBROENCODERDECODERAUDIOSMAPEO SEMANTICOfMRILANGUAGELANGUAGE MODELBRAINENCODERDECODERAUDIOSSEMANTIC MAPPINGEn los últimos años han surgido algunos estudios en los que se analizan imágenes de resonancia magnética funcional (fMRI) mientras se efectúan ciertas tareas relacionadas a la comprensión del lenguaje natural. Siguiendo el éxito del estudio de la concordancia del sistema visual y los modelos de redes profundas, en estos trabajos se preguntan cuán similar es la representación del lenguaje en el cerebro respecto de los nuevos modelos de redes profundas. En particular, varios trabajos se han basado en el dataset liberado por LeBel, Huth y colaboradores (“A natural fMRI dataset for encoding models” [LeBel et al., 2023]), donde se capturaron estas respuestas cerebrales mientras los participantes escuchaban relatos autobiográficos de los podcasts The Moth y Modern Love. Haciendo uso de estos datos, han realizado un mapeo semántico de distintas áreas del cerebro e incluso llegando a la generación de decoders para poder reconstruir semánticamente estas historias a partir de dichas señales cerebrales [Tang et al., 2023]. En esta línea, en la presente tesis, nos preguntamos cuáles pueden ser los efectos de introducir sesgos temáticos en los estímulos utilizados para entrenar los modelos, y si el desempeño mejora al intentar decodificar un estímulo cuyo tema coincide con el del entrenamiento. Para ello, consideramos que aquellas historias con temáticas similares deberían tener ciertas similitudes en el vocabulario utilizado. En primer lugar, buscamos agrupar estas narraciones por el tema principal que tratan, logrando separarlas en dos grupos. Luego, estos subconjuntos fueron utilizados como entrenamiento comparando los efectos que tiene en las reconstrucciones semánticas generadas el hecho de entrenar y evaluar con distintos subconjuntos.In recent years, many studies have emerged in which Functional Magnetic Resonance Imaging (fMRI) are analyzed while carrying out certain tasks related to the understanding of natural language. Following the success with the study of the concordance between the visual system and deep network models, these works ask how similar the representation of language in the brain is with respect to the new deep network models. In particular, several works have been based on the dataset released by LeBel, Huth and collaborators (“A natural fMRI dataset for encoding models” [LeBel et al., 2023]), where these brain responses were captured while participants listened to autobiographical narrations from the podcasts The Moth and Modern Love. Using this data, they have carried out a semantic mapping of different areas of the brain and even gone so far as to generate decoders to be able to semantically reconstruct these stories from the brain signals [Tang et al., 2023]. Following this line, in this thesis, we ask what the effects of introducing thematic biases in the stimuli used to train the models may be, and whether performance improves when trying to decode a stimulus whose theme matches the one used as training. To do this, we consider that those stories with similar themes should have certain similarities in the vocabulary they use. Firstly, we seek to group these narratives by the main theme they talk about, managing to separate them into two groups. Then, these subsets were used as training, comparing the effects that training and evaluating with different subsets has on the semantic reconstructions generated.Fil: Delmagro, Nicolás Agustín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesKamienkowski, Juan EstebanBianchi, Bruno2024-12-20info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000825_Delmagrospainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:43:35Zseminario:seminario_nCOM000825_DelmagroInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:43:36.165Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse |
dc.title.none.fl_str_mv |
Efectos de la categorización de estímulos en la reconstrucción semántica de lenguajes continuos a partir de señales fMRI Effects of stimulus categorization on semantic reconstruction of continuous languages from fMRI signals |
title |
Efectos de la categorización de estímulos en la reconstrucción semántica de lenguajes continuos a partir de señales fMRI |
spellingShingle |
Efectos de la categorización de estímulos en la reconstrucción semántica de lenguajes continuos a partir de señales fMRI Delmagro, Nicolás Agustín fMRI LENGUAJE MODELO DE LENGUAJE CEREBRO ENCODER DECODER AUDIOS MAPEO SEMANTICO fMRI LANGUAGE LANGUAGE MODEL BRAIN ENCODER DECODER AUDIOS SEMANTIC MAPPING |
title_short |
Efectos de la categorización de estímulos en la reconstrucción semántica de lenguajes continuos a partir de señales fMRI |
title_full |
Efectos de la categorización de estímulos en la reconstrucción semántica de lenguajes continuos a partir de señales fMRI |
title_fullStr |
Efectos de la categorización de estímulos en la reconstrucción semántica de lenguajes continuos a partir de señales fMRI |
title_full_unstemmed |
Efectos de la categorización de estímulos en la reconstrucción semántica de lenguajes continuos a partir de señales fMRI |
title_sort |
Efectos de la categorización de estímulos en la reconstrucción semántica de lenguajes continuos a partir de señales fMRI |
dc.creator.none.fl_str_mv |
Delmagro, Nicolás Agustín |
author |
Delmagro, Nicolás Agustín |
author_facet |
Delmagro, Nicolás Agustín |
author_role |
author |
dc.contributor.none.fl_str_mv |
Kamienkowski, Juan Esteban Bianchi, Bruno |
dc.subject.none.fl_str_mv |
fMRI LENGUAJE MODELO DE LENGUAJE CEREBRO ENCODER DECODER AUDIOS MAPEO SEMANTICO fMRI LANGUAGE LANGUAGE MODEL BRAIN ENCODER DECODER AUDIOS SEMANTIC MAPPING |
topic |
fMRI LENGUAJE MODELO DE LENGUAJE CEREBRO ENCODER DECODER AUDIOS MAPEO SEMANTICO fMRI LANGUAGE LANGUAGE MODEL BRAIN ENCODER DECODER AUDIOS SEMANTIC MAPPING |
dc.description.none.fl_txt_mv |
En los últimos años han surgido algunos estudios en los que se analizan imágenes de resonancia magnética funcional (fMRI) mientras se efectúan ciertas tareas relacionadas a la comprensión del lenguaje natural. Siguiendo el éxito del estudio de la concordancia del sistema visual y los modelos de redes profundas, en estos trabajos se preguntan cuán similar es la representación del lenguaje en el cerebro respecto de los nuevos modelos de redes profundas. En particular, varios trabajos se han basado en el dataset liberado por LeBel, Huth y colaboradores (“A natural fMRI dataset for encoding models” [LeBel et al., 2023]), donde se capturaron estas respuestas cerebrales mientras los participantes escuchaban relatos autobiográficos de los podcasts The Moth y Modern Love. Haciendo uso de estos datos, han realizado un mapeo semántico de distintas áreas del cerebro e incluso llegando a la generación de decoders para poder reconstruir semánticamente estas historias a partir de dichas señales cerebrales [Tang et al., 2023]. En esta línea, en la presente tesis, nos preguntamos cuáles pueden ser los efectos de introducir sesgos temáticos en los estímulos utilizados para entrenar los modelos, y si el desempeño mejora al intentar decodificar un estímulo cuyo tema coincide con el del entrenamiento. Para ello, consideramos que aquellas historias con temáticas similares deberían tener ciertas similitudes en el vocabulario utilizado. En primer lugar, buscamos agrupar estas narraciones por el tema principal que tratan, logrando separarlas en dos grupos. Luego, estos subconjuntos fueron utilizados como entrenamiento comparando los efectos que tiene en las reconstrucciones semánticas generadas el hecho de entrenar y evaluar con distintos subconjuntos. In recent years, many studies have emerged in which Functional Magnetic Resonance Imaging (fMRI) are analyzed while carrying out certain tasks related to the understanding of natural language. Following the success with the study of the concordance between the visual system and deep network models, these works ask how similar the representation of language in the brain is with respect to the new deep network models. In particular, several works have been based on the dataset released by LeBel, Huth and collaborators (“A natural fMRI dataset for encoding models” [LeBel et al., 2023]), where these brain responses were captured while participants listened to autobiographical narrations from the podcasts The Moth and Modern Love. Using this data, they have carried out a semantic mapping of different areas of the brain and even gone so far as to generate decoders to be able to semantically reconstruct these stories from the brain signals [Tang et al., 2023]. Following this line, in this thesis, we ask what the effects of introducing thematic biases in the stimuli used to train the models may be, and whether performance improves when trying to decode a stimulus whose theme matches the one used as training. To do this, we consider that those stories with similar themes should have certain similarities in the vocabulary they use. Firstly, we seek to group these narratives by the main theme they talk about, managing to separate them into two groups. Then, these subsets were used as training, comparing the effects that training and evaluating with different subsets has on the semantic reconstructions generated. Fil: Delmagro, Nicolás Agustín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. |
description |
En los últimos años han surgido algunos estudios en los que se analizan imágenes de resonancia magnética funcional (fMRI) mientras se efectúan ciertas tareas relacionadas a la comprensión del lenguaje natural. Siguiendo el éxito del estudio de la concordancia del sistema visual y los modelos de redes profundas, en estos trabajos se preguntan cuán similar es la representación del lenguaje en el cerebro respecto de los nuevos modelos de redes profundas. En particular, varios trabajos se han basado en el dataset liberado por LeBel, Huth y colaboradores (“A natural fMRI dataset for encoding models” [LeBel et al., 2023]), donde se capturaron estas respuestas cerebrales mientras los participantes escuchaban relatos autobiográficos de los podcasts The Moth y Modern Love. Haciendo uso de estos datos, han realizado un mapeo semántico de distintas áreas del cerebro e incluso llegando a la generación de decoders para poder reconstruir semánticamente estas historias a partir de dichas señales cerebrales [Tang et al., 2023]. En esta línea, en la presente tesis, nos preguntamos cuáles pueden ser los efectos de introducir sesgos temáticos en los estímulos utilizados para entrenar los modelos, y si el desempeño mejora al intentar decodificar un estímulo cuyo tema coincide con el del entrenamiento. Para ello, consideramos que aquellas historias con temáticas similares deberían tener ciertas similitudes en el vocabulario utilizado. En primer lugar, buscamos agrupar estas narraciones por el tema principal que tratan, logrando separarlas en dos grupos. Luego, estos subconjuntos fueron utilizados como entrenamiento comparando los efectos que tiene en las reconstrucciones semánticas generadas el hecho de entrenar y evaluar con distintos subconjuntos. |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2024-12-20 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
https://hdl.handle.net/20.500.12110/seminario_nCOM000825_Delmagro |
url |
https://hdl.handle.net/20.500.12110/seminario_nCOM000825_Delmagro |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN |
reponame_str |
Biblioteca Digital (UBA-FCEN) |
collection |
Biblioteca Digital (UBA-FCEN) |
instname_str |
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
instacron_str |
UBA-FCEN |
institution |
UBA-FCEN |
repository.name.fl_str_mv |
Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
repository.mail.fl_str_mv |
ana@bl.fcen.uba.ar |
_version_ |
1844618754820931584 |
score |
13.070432 |