Large Language Models : Aplicaciones en Clasificación de Nombres de Dominio
- Autores
- Bogado García, Joaquín Ignacio
- Año de publicación
- 2024
- Idioma
- español castellano
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- Durante los últimos meses, los grandes modelos de lenguajes (LLMs) han revolucionado varias áreas de la informática. Estos modelos, dado tamaño medido en varios miles de millones de parámetros, parecen inescrutables. Esto nos deja con la sensación de que el tren ya pasó, que no podremos hacer aportes de importancia en el área, que quedaremos relegados a ser meros usuarios de estas tecnologías. Sin embargo, la arquitectura de estos modelos es relativamente simple. Basta aprender algunos conceptos generales para hacerse una idea de su funcionamiento, capacidades y limitaciones. En esta charla voy a contarles mi experiencia implementando mi propio modelo de lenguajes para solucionar un problema particular y voy a hacer hincapié en aquellos conceptos que considero deben aprenderse primero para subirse al tren. Ya sea como usuarios, para comprender qué podemos pedirle a estos modelos y qué no, o como investigadores, para poder identificar las diferencias en las arquitecturas, las mejoras propuestas por nuevas técnicas y los problemas del estado del arte.
Diapositivas presentadas en una reunión interna para investigadores del LIFIA. Mayo/2024.
Laboratorio de Investigación y Formación en Informática Avanzada - Materia
-
Informática
LLMs
Large Languages Models
Inteligencia artificial
Inteligencia Artificial Generativa
Gen IA - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by/4.0/
- Repositorio
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/166148
Ver los metadatos del registro completo
id |
SEDICI_d45bcdd423e8efa89e100a675a523ecc |
---|---|
oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/166148 |
network_acronym_str |
SEDICI |
repository_id_str |
1329 |
network_name_str |
SEDICI (UNLP) |
spelling |
Large Language Models : Aplicaciones en Clasificación de Nombres de DominioBogado García, Joaquín IgnacioInformáticaLLMsLarge Languages ModelsInteligencia artificialInteligencia Artificial GenerativaGen IADurante los últimos meses, los grandes modelos de lenguajes (LLMs) han revolucionado varias áreas de la informática. Estos modelos, dado tamaño medido en varios miles de millones de parámetros, parecen inescrutables. Esto nos deja con la sensación de que el tren ya pasó, que no podremos hacer aportes de importancia en el área, que quedaremos relegados a ser meros usuarios de estas tecnologías. Sin embargo, la arquitectura de estos modelos es relativamente simple. Basta aprender algunos conceptos generales para hacerse una idea de su funcionamiento, capacidades y limitaciones. En esta charla voy a contarles mi experiencia implementando mi propio modelo de lenguajes para solucionar un problema particular y voy a hacer hincapié en aquellos conceptos que considero deben aprenderse primero para subirse al tren. Ya sea como usuarios, para comprender qué podemos pedirle a estos modelos y qué no, o como investigadores, para poder identificar las diferencias en las arquitecturas, las mejoras propuestas por nuevas técnicas y los problemas del estado del arte.Diapositivas presentadas en una reunión interna para investigadores del LIFIA. Mayo/2024.Laboratorio de Investigación y Formación en Informática Avanzada2024-05-16info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/166148spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by/4.0/Creative Commons Attribution 4.0 International (CC BY 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T11:44:05Zoai:sedici.unlp.edu.ar:10915/166148Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 11:44:06.027SEDICI (UNLP) - Universidad Nacional de La Platafalse |
dc.title.none.fl_str_mv |
Large Language Models : Aplicaciones en Clasificación de Nombres de Dominio |
title |
Large Language Models : Aplicaciones en Clasificación de Nombres de Dominio |
spellingShingle |
Large Language Models : Aplicaciones en Clasificación de Nombres de Dominio Bogado García, Joaquín Ignacio Informática LLMs Large Languages Models Inteligencia artificial Inteligencia Artificial Generativa Gen IA |
title_short |
Large Language Models : Aplicaciones en Clasificación de Nombres de Dominio |
title_full |
Large Language Models : Aplicaciones en Clasificación de Nombres de Dominio |
title_fullStr |
Large Language Models : Aplicaciones en Clasificación de Nombres de Dominio |
title_full_unstemmed |
Large Language Models : Aplicaciones en Clasificación de Nombres de Dominio |
title_sort |
Large Language Models : Aplicaciones en Clasificación de Nombres de Dominio |
dc.creator.none.fl_str_mv |
Bogado García, Joaquín Ignacio |
author |
Bogado García, Joaquín Ignacio |
author_facet |
Bogado García, Joaquín Ignacio |
author_role |
author |
dc.subject.none.fl_str_mv |
Informática LLMs Large Languages Models Inteligencia artificial Inteligencia Artificial Generativa Gen IA |
topic |
Informática LLMs Large Languages Models Inteligencia artificial Inteligencia Artificial Generativa Gen IA |
dc.description.none.fl_txt_mv |
Durante los últimos meses, los grandes modelos de lenguajes (LLMs) han revolucionado varias áreas de la informática. Estos modelos, dado tamaño medido en varios miles de millones de parámetros, parecen inescrutables. Esto nos deja con la sensación de que el tren ya pasó, que no podremos hacer aportes de importancia en el área, que quedaremos relegados a ser meros usuarios de estas tecnologías. Sin embargo, la arquitectura de estos modelos es relativamente simple. Basta aprender algunos conceptos generales para hacerse una idea de su funcionamiento, capacidades y limitaciones. En esta charla voy a contarles mi experiencia implementando mi propio modelo de lenguajes para solucionar un problema particular y voy a hacer hincapié en aquellos conceptos que considero deben aprenderse primero para subirse al tren. Ya sea como usuarios, para comprender qué podemos pedirle a estos modelos y qué no, o como investigadores, para poder identificar las diferencias en las arquitecturas, las mejoras propuestas por nuevas técnicas y los problemas del estado del arte. Diapositivas presentadas en una reunión interna para investigadores del LIFIA. Mayo/2024. Laboratorio de Investigación y Formación en Informática Avanzada |
description |
Durante los últimos meses, los grandes modelos de lenguajes (LLMs) han revolucionado varias áreas de la informática. Estos modelos, dado tamaño medido en varios miles de millones de parámetros, parecen inescrutables. Esto nos deja con la sensación de que el tren ya pasó, que no podremos hacer aportes de importancia en el área, que quedaremos relegados a ser meros usuarios de estas tecnologías. Sin embargo, la arquitectura de estos modelos es relativamente simple. Basta aprender algunos conceptos generales para hacerse una idea de su funcionamiento, capacidades y limitaciones. En esta charla voy a contarles mi experiencia implementando mi propio modelo de lenguajes para solucionar un problema particular y voy a hacer hincapié en aquellos conceptos que considero deben aprenderse primero para subirse al tren. Ya sea como usuarios, para comprender qué podemos pedirle a estos modelos y qué no, o como investigadores, para poder identificar las diferencias en las arquitecturas, las mejoras propuestas por nuevas técnicas y los problemas del estado del arte. |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2024-05-16 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
format |
conferenceObject |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/166148 |
url |
http://sedici.unlp.edu.ar/handle/10915/166148 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by/4.0/ Creative Commons Attribution 4.0 International (CC BY 4.0) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by/4.0/ Creative Commons Attribution 4.0 International (CC BY 4.0) |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
reponame_str |
SEDICI (UNLP) |
collection |
SEDICI (UNLP) |
instname_str |
Universidad Nacional de La Plata |
instacron_str |
UNLP |
institution |
UNLP |
repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
_version_ |
1844616308647264256 |
score |
13.070432 |