Hacia un método computacional para detectar léxico contrastivo
- Autores
- Alemán, Damián Eliel
- Año de publicación
- 2017
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Gravano, Agustín
Kalinowski, Santiago
Pérez, Juan Manuel - Descripción
- El crecimiento de la cantidad de datos en la web y los recursos computacionales de las últimas décadas dan la posibilidad de investigar fenómenos lingüísticos a gran escala, tarea casi imposible de realizar manualmente. En el área de la lexicografía se conoce como palabras contrastivas, a aquellas de una misma lengua que tienen una frecuencia de uso significativamente distinta en dos o más regiones. En el presente trabajo desarrollamos una métrica para detectar estas palabras. Esta hace uso de la entropía de la información sobre la cantidad de ocurrencias de cada palabra y la cantidad de usuarios que la usan para dar un indicio de la contrastividad. Para evaluarla se recolectó a partir de Twitter un conjunto de datos con más de 190 millones de palabras escritas y más de 20 mil usuarios de las 23 provincias argentinas. Este trabajo multidisciplinario se hizo en colaboración de la Academia Argentina de Letras, la cual realizó la validación y comprobó diferencias relevantes en la extensión de uso de unas 300 palabras. Varias de ellas formarán parte de las palabras del Diccionario del habla de los argentinos del año próximo.
Fil: Alemán, Damián Eliel. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. - Materia
-
PROCESAMIENTO DEL LENGUAJE NATURAL
LINGUISTICA COMPUTACIONAL
LEXICOGRAFIA CONTRASTIVA - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar
- Repositorio
- Institución
- Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
- OAI Identificador
- seminario:seminario_nCOM000646_Aleman
Ver los metadatos del registro completo
id |
BDUBAFCEN_bdf96f82ce8dce8b893c2631052e9065 |
---|---|
oai_identifier_str |
seminario:seminario_nCOM000646_Aleman |
network_acronym_str |
BDUBAFCEN |
repository_id_str |
1896 |
network_name_str |
Biblioteca Digital (UBA-FCEN) |
spelling |
Hacia un método computacional para detectar léxico contrastivoAlemán, Damián ElielPROCESAMIENTO DEL LENGUAJE NATURALLINGUISTICA COMPUTACIONALLEXICOGRAFIA CONTRASTIVAEl crecimiento de la cantidad de datos en la web y los recursos computacionales de las últimas décadas dan la posibilidad de investigar fenómenos lingüísticos a gran escala, tarea casi imposible de realizar manualmente. En el área de la lexicografía se conoce como palabras contrastivas, a aquellas de una misma lengua que tienen una frecuencia de uso significativamente distinta en dos o más regiones. En el presente trabajo desarrollamos una métrica para detectar estas palabras. Esta hace uso de la entropía de la información sobre la cantidad de ocurrencias de cada palabra y la cantidad de usuarios que la usan para dar un indicio de la contrastividad. Para evaluarla se recolectó a partir de Twitter un conjunto de datos con más de 190 millones de palabras escritas y más de 20 mil usuarios de las 23 provincias argentinas. Este trabajo multidisciplinario se hizo en colaboración de la Academia Argentina de Letras, la cual realizó la validación y comprobó diferencias relevantes en la extensión de uso de unas 300 palabras. Varias de ellas formarán parte de las palabras del Diccionario del habla de los argentinos del año próximo.Fil: Alemán, Damián Eliel. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesGravano, AgustínKalinowski, SantiagoPérez, Juan Manuel2017info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000646_Alemanspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:43:38Zseminario:seminario_nCOM000646_AlemanInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:43:39.841Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse |
dc.title.none.fl_str_mv |
Hacia un método computacional para detectar léxico contrastivo |
title |
Hacia un método computacional para detectar léxico contrastivo |
spellingShingle |
Hacia un método computacional para detectar léxico contrastivo Alemán, Damián Eliel PROCESAMIENTO DEL LENGUAJE NATURAL LINGUISTICA COMPUTACIONAL LEXICOGRAFIA CONTRASTIVA |
title_short |
Hacia un método computacional para detectar léxico contrastivo |
title_full |
Hacia un método computacional para detectar léxico contrastivo |
title_fullStr |
Hacia un método computacional para detectar léxico contrastivo |
title_full_unstemmed |
Hacia un método computacional para detectar léxico contrastivo |
title_sort |
Hacia un método computacional para detectar léxico contrastivo |
dc.creator.none.fl_str_mv |
Alemán, Damián Eliel |
author |
Alemán, Damián Eliel |
author_facet |
Alemán, Damián Eliel |
author_role |
author |
dc.contributor.none.fl_str_mv |
Gravano, Agustín Kalinowski, Santiago Pérez, Juan Manuel |
dc.subject.none.fl_str_mv |
PROCESAMIENTO DEL LENGUAJE NATURAL LINGUISTICA COMPUTACIONAL LEXICOGRAFIA CONTRASTIVA |
topic |
PROCESAMIENTO DEL LENGUAJE NATURAL LINGUISTICA COMPUTACIONAL LEXICOGRAFIA CONTRASTIVA |
dc.description.none.fl_txt_mv |
El crecimiento de la cantidad de datos en la web y los recursos computacionales de las últimas décadas dan la posibilidad de investigar fenómenos lingüísticos a gran escala, tarea casi imposible de realizar manualmente. En el área de la lexicografía se conoce como palabras contrastivas, a aquellas de una misma lengua que tienen una frecuencia de uso significativamente distinta en dos o más regiones. En el presente trabajo desarrollamos una métrica para detectar estas palabras. Esta hace uso de la entropía de la información sobre la cantidad de ocurrencias de cada palabra y la cantidad de usuarios que la usan para dar un indicio de la contrastividad. Para evaluarla se recolectó a partir de Twitter un conjunto de datos con más de 190 millones de palabras escritas y más de 20 mil usuarios de las 23 provincias argentinas. Este trabajo multidisciplinario se hizo en colaboración de la Academia Argentina de Letras, la cual realizó la validación y comprobó diferencias relevantes en la extensión de uso de unas 300 palabras. Varias de ellas formarán parte de las palabras del Diccionario del habla de los argentinos del año próximo. Fil: Alemán, Damián Eliel. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. |
description |
El crecimiento de la cantidad de datos en la web y los recursos computacionales de las últimas décadas dan la posibilidad de investigar fenómenos lingüísticos a gran escala, tarea casi imposible de realizar manualmente. En el área de la lexicografía se conoce como palabras contrastivas, a aquellas de una misma lengua que tienen una frecuencia de uso significativamente distinta en dos o más regiones. En el presente trabajo desarrollamos una métrica para detectar estas palabras. Esta hace uso de la entropía de la información sobre la cantidad de ocurrencias de cada palabra y la cantidad de usuarios que la usan para dar un indicio de la contrastividad. Para evaluarla se recolectó a partir de Twitter un conjunto de datos con más de 190 millones de palabras escritas y más de 20 mil usuarios de las 23 provincias argentinas. Este trabajo multidisciplinario se hizo en colaboración de la Academia Argentina de Letras, la cual realizó la validación y comprobó diferencias relevantes en la extensión de uso de unas 300 palabras. Varias de ellas formarán parte de las palabras del Diccionario del habla de los argentinos del año próximo. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
https://hdl.handle.net/20.500.12110/seminario_nCOM000646_Aleman |
url |
https://hdl.handle.net/20.500.12110/seminario_nCOM000646_Aleman |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN |
reponame_str |
Biblioteca Digital (UBA-FCEN) |
collection |
Biblioteca Digital (UBA-FCEN) |
instname_str |
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
instacron_str |
UBA-FCEN |
institution |
UBA-FCEN |
repository.name.fl_str_mv |
Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
repository.mail.fl_str_mv |
ana@bl.fcen.uba.ar |
_version_ |
1844618756650696704 |
score |
13.070432 |