Hacia un método computacional para detectar léxico contrastivo

Autores
Alemán, Damián Eliel
Año de publicación
2017
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Gravano, Agustín
Kalinowski, Santiago
Pérez, Juan Manuel
Descripción
El crecimiento de la cantidad de datos en la web y los recursos computacionales de las últimas décadas dan la posibilidad de investigar fenómenos lingüísticos a gran escala, tarea casi imposible de realizar manualmente. En el área de la lexicografía se conoce como palabras contrastivas, a aquellas de una misma lengua que tienen una frecuencia de uso significativamente distinta en dos o más regiones. En el presente trabajo desarrollamos una métrica para detectar estas palabras. Esta hace uso de la entropía de la información sobre la cantidad de ocurrencias de cada palabra y la cantidad de usuarios que la usan para dar un indicio de la contrastividad. Para evaluarla se recolectó a partir de Twitter un conjunto de datos con más de 190 millones de palabras escritas y más de 20 mil usuarios de las 23 provincias argentinas. Este trabajo multidisciplinario se hizo en colaboración de la Academia Argentina de Letras, la cual realizó la validación y comprobó diferencias relevantes en la extensión de uso de unas 300 palabras. Varias de ellas formarán parte de las palabras del Diccionario del habla de los argentinos del año próximo.
Fil: Alemán, Damián Eliel. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
PROCESAMIENTO DEL LENGUAJE NATURAL
LINGUISTICA COMPUTACIONAL
LEXICOGRAFIA CONTRASTIVA
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
seminario:seminario_nCOM000646_Aleman

id BDUBAFCEN_bdf96f82ce8dce8b893c2631052e9065
oai_identifier_str seminario:seminario_nCOM000646_Aleman
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Hacia un método computacional para detectar léxico contrastivoAlemán, Damián ElielPROCESAMIENTO DEL LENGUAJE NATURALLINGUISTICA COMPUTACIONALLEXICOGRAFIA CONTRASTIVAEl crecimiento de la cantidad de datos en la web y los recursos computacionales de las últimas décadas dan la posibilidad de investigar fenómenos lingüísticos a gran escala, tarea casi imposible de realizar manualmente. En el área de la lexicografía se conoce como palabras contrastivas, a aquellas de una misma lengua que tienen una frecuencia de uso significativamente distinta en dos o más regiones. En el presente trabajo desarrollamos una métrica para detectar estas palabras. Esta hace uso de la entropía de la información sobre la cantidad de ocurrencias de cada palabra y la cantidad de usuarios que la usan para dar un indicio de la contrastividad. Para evaluarla se recolectó a partir de Twitter un conjunto de datos con más de 190 millones de palabras escritas y más de 20 mil usuarios de las 23 provincias argentinas. Este trabajo multidisciplinario se hizo en colaboración de la Academia Argentina de Letras, la cual realizó la validación y comprobó diferencias relevantes en la extensión de uso de unas 300 palabras. Varias de ellas formarán parte de las palabras del Diccionario del habla de los argentinos del año próximo.Fil: Alemán, Damián Eliel. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesGravano, AgustínKalinowski, SantiagoPérez, Juan Manuel2017info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000646_Alemanspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:43:38Zseminario:seminario_nCOM000646_AlemanInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:43:39.841Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Hacia un método computacional para detectar léxico contrastivo
title Hacia un método computacional para detectar léxico contrastivo
spellingShingle Hacia un método computacional para detectar léxico contrastivo
Alemán, Damián Eliel
PROCESAMIENTO DEL LENGUAJE NATURAL
LINGUISTICA COMPUTACIONAL
LEXICOGRAFIA CONTRASTIVA
title_short Hacia un método computacional para detectar léxico contrastivo
title_full Hacia un método computacional para detectar léxico contrastivo
title_fullStr Hacia un método computacional para detectar léxico contrastivo
title_full_unstemmed Hacia un método computacional para detectar léxico contrastivo
title_sort Hacia un método computacional para detectar léxico contrastivo
dc.creator.none.fl_str_mv Alemán, Damián Eliel
author Alemán, Damián Eliel
author_facet Alemán, Damián Eliel
author_role author
dc.contributor.none.fl_str_mv Gravano, Agustín
Kalinowski, Santiago
Pérez, Juan Manuel
dc.subject.none.fl_str_mv PROCESAMIENTO DEL LENGUAJE NATURAL
LINGUISTICA COMPUTACIONAL
LEXICOGRAFIA CONTRASTIVA
topic PROCESAMIENTO DEL LENGUAJE NATURAL
LINGUISTICA COMPUTACIONAL
LEXICOGRAFIA CONTRASTIVA
dc.description.none.fl_txt_mv El crecimiento de la cantidad de datos en la web y los recursos computacionales de las últimas décadas dan la posibilidad de investigar fenómenos lingüísticos a gran escala, tarea casi imposible de realizar manualmente. En el área de la lexicografía se conoce como palabras contrastivas, a aquellas de una misma lengua que tienen una frecuencia de uso significativamente distinta en dos o más regiones. En el presente trabajo desarrollamos una métrica para detectar estas palabras. Esta hace uso de la entropía de la información sobre la cantidad de ocurrencias de cada palabra y la cantidad de usuarios que la usan para dar un indicio de la contrastividad. Para evaluarla se recolectó a partir de Twitter un conjunto de datos con más de 190 millones de palabras escritas y más de 20 mil usuarios de las 23 provincias argentinas. Este trabajo multidisciplinario se hizo en colaboración de la Academia Argentina de Letras, la cual realizó la validación y comprobó diferencias relevantes en la extensión de uso de unas 300 palabras. Varias de ellas formarán parte de las palabras del Diccionario del habla de los argentinos del año próximo.
Fil: Alemán, Damián Eliel. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description El crecimiento de la cantidad de datos en la web y los recursos computacionales de las últimas décadas dan la posibilidad de investigar fenómenos lingüísticos a gran escala, tarea casi imposible de realizar manualmente. En el área de la lexicografía se conoce como palabras contrastivas, a aquellas de una misma lengua que tienen una frecuencia de uso significativamente distinta en dos o más regiones. En el presente trabajo desarrollamos una métrica para detectar estas palabras. Esta hace uso de la entropía de la información sobre la cantidad de ocurrencias de cada palabra y la cantidad de usuarios que la usan para dar un indicio de la contrastividad. Para evaluarla se recolectó a partir de Twitter un conjunto de datos con más de 190 millones de palabras escritas y más de 20 mil usuarios de las 23 provincias argentinas. Este trabajo multidisciplinario se hizo en colaboración de la Academia Argentina de Letras, la cual realizó la validación y comprobó diferencias relevantes en la extensión de uso de unas 300 palabras. Varias de ellas formarán parte de las palabras del Diccionario del habla de los argentinos del año próximo.
publishDate 2017
dc.date.none.fl_str_mv 2017
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/seminario_nCOM000646_Aleman
url https://hdl.handle.net/20.500.12110/seminario_nCOM000646_Aleman
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1844618756650696704
score 13.070432