Extracción de información de películas a través de subtítulos utilizando atributos sintácticos y semánticos en español

Autores
Masseroli, Alejandro Daniel
Año de publicación
2016
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Altszyler, Edgar
Brusco, Pablo Daniel
Descripción
El procesamiento de lenguaje natural es un área que combina la inteligencia artificial y la lingüística para permitir la comprensión automática de información expresada en lenguaje humano. En el contexto de esta tesis, lo aplicamos al estudio de diálogos de películas. El objetivo principal de este con la estructura gramatical y trabajo es analizar en qué medida el género de una película se relaciona no solo con la trama ino también con la estructura gramatical y el contenido emocional de sus diálogos, tomando como representaci´on de los mismos sus subt´ıtulos en espa˜nol. Con este fin, estudiamos de qué manera el género está asociado a la estructura gramatical de los diálogos de las películas, sin tomar en cuenta el contenido de aquello que se está diciendo. Luego, en una segunda etapa analizamos, cómo la relación existente entre el género y las emociones transmitidas en el contenido de los diálogos. Para realizar nuestros experimentos, extrajimos atributos a partir de subtítulos que capturan aspectos de la estructura gramatical y del contenido emocional que luego fueron utilizados en clasificadores automáticos que infieren el género de películas a partir de esta información. El análisis realizado nos permite concluir que el género de una película tiene se relaciona considerablemente tanto con la gramática de sus diálogos como con las emociones que estos transmiten.
Natural Language Processing is an area that combines both artificial intelligence and linguistics to pursue the automatic understanding of information expressed in human language. In the context of this thesis, we apply it to the study of film subtitles. Our main goal is to analyze to what extent the genre of a film is related not only to the plot but also to the grammatical structure and emotional content of its dialogues, taking its Spanish subtitles as its representation. To this end, we study how genre is related to the grammatical structure of the film dialogues, without taking into account the content of what is being said. Then, in a second stage, we analyze the relationship between genre and the emotions transmitted in the content of the dialogues. In order to perform our experiments, we extracted features from the subtitles that capture aspects of grammatical structure and emotional content. Then they were fed into automatic classifiers that infer the genre of films from this information. The analysis allows us to conclude that the genre of a film is substantially related both to the grammar of its dialogues and to the emotions it transmits.
Fil: Masseroli, Alejandro Daniel. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
APRENDIZAJE AUTOMATICO
PROCESAMIENTO DE LENGUAJE NATURAL
CLASIFICACION AUTOMATICA DE TEXTO
ANALISIS AUTOMATICO DE EMOCIONES
MACHINE LEARNING
NATURAL LANGUAGE PROCESSING
AUTOMATIC TEXT CLASSIFICATION
AUTOMATIC EMOTION ANALYSIS
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
seminario:seminario_nCOM000650_Masseroli

id BDUBAFCEN_b092388be8688190d1ad18c0a7fe8b08
oai_identifier_str seminario:seminario_nCOM000650_Masseroli
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Extracción de información de películas a través de subtítulos utilizando atributos sintácticos y semánticos en españolFilm information extraction using syntactic and semantic features from spanish subtitlesMasseroli, Alejandro DanielAPRENDIZAJE AUTOMATICOPROCESAMIENTO DE LENGUAJE NATURALCLASIFICACION AUTOMATICA DE TEXTOANALISIS AUTOMATICO DE EMOCIONESMACHINE LEARNINGNATURAL LANGUAGE PROCESSINGAUTOMATIC TEXT CLASSIFICATIONAUTOMATIC EMOTION ANALYSISEl procesamiento de lenguaje natural es un área que combina la inteligencia artificial y la lingüística para permitir la comprensión automática de información expresada en lenguaje humano. En el contexto de esta tesis, lo aplicamos al estudio de diálogos de películas. El objetivo principal de este con la estructura gramatical y trabajo es analizar en qué medida el género de una película se relaciona no solo con la trama ino también con la estructura gramatical y el contenido emocional de sus diálogos, tomando como representaci´on de los mismos sus subt´ıtulos en espa˜nol. Con este fin, estudiamos de qué manera el género está asociado a la estructura gramatical de los diálogos de las películas, sin tomar en cuenta el contenido de aquello que se está diciendo. Luego, en una segunda etapa analizamos, cómo la relación existente entre el género y las emociones transmitidas en el contenido de los diálogos. Para realizar nuestros experimentos, extrajimos atributos a partir de subtítulos que capturan aspectos de la estructura gramatical y del contenido emocional que luego fueron utilizados en clasificadores automáticos que infieren el género de películas a partir de esta información. El análisis realizado nos permite concluir que el género de una película tiene se relaciona considerablemente tanto con la gramática de sus diálogos como con las emociones que estos transmiten.Natural Language Processing is an area that combines both artificial intelligence and linguistics to pursue the automatic understanding of information expressed in human language. In the context of this thesis, we apply it to the study of film subtitles. Our main goal is to analyze to what extent the genre of a film is related not only to the plot but also to the grammatical structure and emotional content of its dialogues, taking its Spanish subtitles as its representation. To this end, we study how genre is related to the grammatical structure of the film dialogues, without taking into account the content of what is being said. Then, in a second stage, we analyze the relationship between genre and the emotions transmitted in the content of the dialogues. In order to perform our experiments, we extracted features from the subtitles that capture aspects of grammatical structure and emotional content. Then they were fed into automatic classifiers that infer the genre of films from this information. The analysis allows us to conclude that the genre of a film is substantially related both to the grammar of its dialogues and to the emotions it transmits.Fil: Masseroli, Alejandro Daniel. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesAltszyler, EdgarBrusco, Pablo Daniel2016info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000650_Masserolispainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-10-23T11:19:03Zseminario:seminario_nCOM000650_MasseroliInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-10-23 11:19:03.888Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Extracción de información de películas a través de subtítulos utilizando atributos sintácticos y semánticos en español
Film information extraction using syntactic and semantic features from spanish subtitles
title Extracción de información de películas a través de subtítulos utilizando atributos sintácticos y semánticos en español
spellingShingle Extracción de información de películas a través de subtítulos utilizando atributos sintácticos y semánticos en español
Masseroli, Alejandro Daniel
APRENDIZAJE AUTOMATICO
PROCESAMIENTO DE LENGUAJE NATURAL
CLASIFICACION AUTOMATICA DE TEXTO
ANALISIS AUTOMATICO DE EMOCIONES
MACHINE LEARNING
NATURAL LANGUAGE PROCESSING
AUTOMATIC TEXT CLASSIFICATION
AUTOMATIC EMOTION ANALYSIS
title_short Extracción de información de películas a través de subtítulos utilizando atributos sintácticos y semánticos en español
title_full Extracción de información de películas a través de subtítulos utilizando atributos sintácticos y semánticos en español
title_fullStr Extracción de información de películas a través de subtítulos utilizando atributos sintácticos y semánticos en español
title_full_unstemmed Extracción de información de películas a través de subtítulos utilizando atributos sintácticos y semánticos en español
title_sort Extracción de información de películas a través de subtítulos utilizando atributos sintácticos y semánticos en español
dc.creator.none.fl_str_mv Masseroli, Alejandro Daniel
author Masseroli, Alejandro Daniel
author_facet Masseroli, Alejandro Daniel
author_role author
dc.contributor.none.fl_str_mv Altszyler, Edgar
Brusco, Pablo Daniel
dc.subject.none.fl_str_mv APRENDIZAJE AUTOMATICO
PROCESAMIENTO DE LENGUAJE NATURAL
CLASIFICACION AUTOMATICA DE TEXTO
ANALISIS AUTOMATICO DE EMOCIONES
MACHINE LEARNING
NATURAL LANGUAGE PROCESSING
AUTOMATIC TEXT CLASSIFICATION
AUTOMATIC EMOTION ANALYSIS
topic APRENDIZAJE AUTOMATICO
PROCESAMIENTO DE LENGUAJE NATURAL
CLASIFICACION AUTOMATICA DE TEXTO
ANALISIS AUTOMATICO DE EMOCIONES
MACHINE LEARNING
NATURAL LANGUAGE PROCESSING
AUTOMATIC TEXT CLASSIFICATION
AUTOMATIC EMOTION ANALYSIS
dc.description.none.fl_txt_mv El procesamiento de lenguaje natural es un área que combina la inteligencia artificial y la lingüística para permitir la comprensión automática de información expresada en lenguaje humano. En el contexto de esta tesis, lo aplicamos al estudio de diálogos de películas. El objetivo principal de este con la estructura gramatical y trabajo es analizar en qué medida el género de una película se relaciona no solo con la trama ino también con la estructura gramatical y el contenido emocional de sus diálogos, tomando como representaci´on de los mismos sus subt´ıtulos en espa˜nol. Con este fin, estudiamos de qué manera el género está asociado a la estructura gramatical de los diálogos de las películas, sin tomar en cuenta el contenido de aquello que se está diciendo. Luego, en una segunda etapa analizamos, cómo la relación existente entre el género y las emociones transmitidas en el contenido de los diálogos. Para realizar nuestros experimentos, extrajimos atributos a partir de subtítulos que capturan aspectos de la estructura gramatical y del contenido emocional que luego fueron utilizados en clasificadores automáticos que infieren el género de películas a partir de esta información. El análisis realizado nos permite concluir que el género de una película tiene se relaciona considerablemente tanto con la gramática de sus diálogos como con las emociones que estos transmiten.
Natural Language Processing is an area that combines both artificial intelligence and linguistics to pursue the automatic understanding of information expressed in human language. In the context of this thesis, we apply it to the study of film subtitles. Our main goal is to analyze to what extent the genre of a film is related not only to the plot but also to the grammatical structure and emotional content of its dialogues, taking its Spanish subtitles as its representation. To this end, we study how genre is related to the grammatical structure of the film dialogues, without taking into account the content of what is being said. Then, in a second stage, we analyze the relationship between genre and the emotions transmitted in the content of the dialogues. In order to perform our experiments, we extracted features from the subtitles that capture aspects of grammatical structure and emotional content. Then they were fed into automatic classifiers that infer the genre of films from this information. The analysis allows us to conclude that the genre of a film is substantially related both to the grammar of its dialogues and to the emotions it transmits.
Fil: Masseroli, Alejandro Daniel. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description El procesamiento de lenguaje natural es un área que combina la inteligencia artificial y la lingüística para permitir la comprensión automática de información expresada en lenguaje humano. En el contexto de esta tesis, lo aplicamos al estudio de diálogos de películas. El objetivo principal de este con la estructura gramatical y trabajo es analizar en qué medida el género de una película se relaciona no solo con la trama ino también con la estructura gramatical y el contenido emocional de sus diálogos, tomando como representaci´on de los mismos sus subt´ıtulos en espa˜nol. Con este fin, estudiamos de qué manera el género está asociado a la estructura gramatical de los diálogos de las películas, sin tomar en cuenta el contenido de aquello que se está diciendo. Luego, en una segunda etapa analizamos, cómo la relación existente entre el género y las emociones transmitidas en el contenido de los diálogos. Para realizar nuestros experimentos, extrajimos atributos a partir de subtítulos que capturan aspectos de la estructura gramatical y del contenido emocional que luego fueron utilizados en clasificadores automáticos que infieren el género de películas a partir de esta información. El análisis realizado nos permite concluir que el género de una película tiene se relaciona considerablemente tanto con la gramática de sus diálogos como con las emociones que estos transmiten.
publishDate 2016
dc.date.none.fl_str_mv 2016
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/seminario_nCOM000650_Masseroli
url https://hdl.handle.net/20.500.12110/seminario_nCOM000650_Masseroli
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1846784894387093504
score 12.982451