Large Language Models : Aplicaciones en Clasificación de Nombres de Dominio

Autores
Bogado García, Joaquín Ignacio
Año de publicación
2024
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
Durante los últimos meses, los grandes modelos de lenguajes (LLMs) han revolucionado varias áreas de la informática. Estos modelos, dado tamaño medido en varios miles de millones de parámetros, parecen inescrutables. Esto nos deja con la sensación de que el tren ya pasó, que no podremos hacer aportes de importancia en el área, que quedaremos relegados a ser meros usuarios de estas tecnologías. Sin embargo, la arquitectura de estos modelos es relativamente simple. Basta aprender algunos conceptos generales para hacerse una idea de su funcionamiento, capacidades y limitaciones. En esta charla voy a contarles mi experiencia implementando mi propio modelo de lenguajes para solucionar un problema particular y voy a hacer hincapié en aquellos conceptos que considero deben aprenderse primero para subirse al tren. Ya sea como usuarios, para comprender qué podemos pedirle a estos modelos y qué no, o como investigadores, para poder identificar las diferencias en las arquitecturas, las mejoras propuestas por nuevas técnicas y los problemas del estado del arte.
Diapositivas presentadas en una reunión interna para investigadores del LIFIA. Mayo/2024.
Laboratorio de Investigación y Formación en Informática Avanzada
Materia
Informática
LLMs
Large Languages Models
Inteligencia artificial
Inteligencia Artificial Generativa
Gen IA
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/166148

id SEDICI_d45bcdd423e8efa89e100a675a523ecc
oai_identifier_str oai:sedici.unlp.edu.ar:10915/166148
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Large Language Models : Aplicaciones en Clasificación de Nombres de DominioBogado García, Joaquín IgnacioInformáticaLLMsLarge Languages ModelsInteligencia artificialInteligencia Artificial GenerativaGen IADurante los últimos meses, los grandes modelos de lenguajes (LLMs) han revolucionado varias áreas de la informática. Estos modelos, dado tamaño medido en varios miles de millones de parámetros, parecen inescrutables. Esto nos deja con la sensación de que el tren ya pasó, que no podremos hacer aportes de importancia en el área, que quedaremos relegados a ser meros usuarios de estas tecnologías. Sin embargo, la arquitectura de estos modelos es relativamente simple. Basta aprender algunos conceptos generales para hacerse una idea de su funcionamiento, capacidades y limitaciones. En esta charla voy a contarles mi experiencia implementando mi propio modelo de lenguajes para solucionar un problema particular y voy a hacer hincapié en aquellos conceptos que considero deben aprenderse primero para subirse al tren. Ya sea como usuarios, para comprender qué podemos pedirle a estos modelos y qué no, o como investigadores, para poder identificar las diferencias en las arquitecturas, las mejoras propuestas por nuevas técnicas y los problemas del estado del arte.Diapositivas presentadas en una reunión interna para investigadores del LIFIA. Mayo/2024.Laboratorio de Investigación y Formación en Informática Avanzada2024-05-16info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/166148spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by/4.0/Creative Commons Attribution 4.0 International (CC BY 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T11:44:05Zoai:sedici.unlp.edu.ar:10915/166148Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 11:44:06.027SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Large Language Models : Aplicaciones en Clasificación de Nombres de Dominio
title Large Language Models : Aplicaciones en Clasificación de Nombres de Dominio
spellingShingle Large Language Models : Aplicaciones en Clasificación de Nombres de Dominio
Bogado García, Joaquín Ignacio
Informática
LLMs
Large Languages Models
Inteligencia artificial
Inteligencia Artificial Generativa
Gen IA
title_short Large Language Models : Aplicaciones en Clasificación de Nombres de Dominio
title_full Large Language Models : Aplicaciones en Clasificación de Nombres de Dominio
title_fullStr Large Language Models : Aplicaciones en Clasificación de Nombres de Dominio
title_full_unstemmed Large Language Models : Aplicaciones en Clasificación de Nombres de Dominio
title_sort Large Language Models : Aplicaciones en Clasificación de Nombres de Dominio
dc.creator.none.fl_str_mv Bogado García, Joaquín Ignacio
author Bogado García, Joaquín Ignacio
author_facet Bogado García, Joaquín Ignacio
author_role author
dc.subject.none.fl_str_mv Informática
LLMs
Large Languages Models
Inteligencia artificial
Inteligencia Artificial Generativa
Gen IA
topic Informática
LLMs
Large Languages Models
Inteligencia artificial
Inteligencia Artificial Generativa
Gen IA
dc.description.none.fl_txt_mv Durante los últimos meses, los grandes modelos de lenguajes (LLMs) han revolucionado varias áreas de la informática. Estos modelos, dado tamaño medido en varios miles de millones de parámetros, parecen inescrutables. Esto nos deja con la sensación de que el tren ya pasó, que no podremos hacer aportes de importancia en el área, que quedaremos relegados a ser meros usuarios de estas tecnologías. Sin embargo, la arquitectura de estos modelos es relativamente simple. Basta aprender algunos conceptos generales para hacerse una idea de su funcionamiento, capacidades y limitaciones. En esta charla voy a contarles mi experiencia implementando mi propio modelo de lenguajes para solucionar un problema particular y voy a hacer hincapié en aquellos conceptos que considero deben aprenderse primero para subirse al tren. Ya sea como usuarios, para comprender qué podemos pedirle a estos modelos y qué no, o como investigadores, para poder identificar las diferencias en las arquitecturas, las mejoras propuestas por nuevas técnicas y los problemas del estado del arte.
Diapositivas presentadas en una reunión interna para investigadores del LIFIA. Mayo/2024.
Laboratorio de Investigación y Formación en Informática Avanzada
description Durante los últimos meses, los grandes modelos de lenguajes (LLMs) han revolucionado varias áreas de la informática. Estos modelos, dado tamaño medido en varios miles de millones de parámetros, parecen inescrutables. Esto nos deja con la sensación de que el tren ya pasó, que no podremos hacer aportes de importancia en el área, que quedaremos relegados a ser meros usuarios de estas tecnologías. Sin embargo, la arquitectura de estos modelos es relativamente simple. Basta aprender algunos conceptos generales para hacerse una idea de su funcionamiento, capacidades y limitaciones. En esta charla voy a contarles mi experiencia implementando mi propio modelo de lenguajes para solucionar un problema particular y voy a hacer hincapié en aquellos conceptos que considero deben aprenderse primero para subirse al tren. Ya sea como usuarios, para comprender qué podemos pedirle a estos modelos y qué no, o como investigadores, para poder identificar las diferencias en las arquitecturas, las mejoras propuestas por nuevas técnicas y los problemas del estado del arte.
publishDate 2024
dc.date.none.fl_str_mv 2024-05-16
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/166148
url http://sedici.unlp.edu.ar/handle/10915/166148
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by/4.0/
Creative Commons Attribution 4.0 International (CC BY 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/4.0/
Creative Commons Attribution 4.0 International (CC BY 4.0)
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1844616308647264256
score 13.070432