Desarrollo de un sistema multiagente basado en Modelos de Lenguaje Grande para la predicción de radiación solar utilizando datos meteorológicos

Autores
Olivera, Lucas; Cappelletti, Marcelo Ángel; Morales, Martín
Año de publicación
2025
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
Este artículo corto presenta un trabajo en desarrollo basado en un enfoque híbrido para la estimación de la radiación solar global horaria bajo condiciones de cielo variables, combinando técnicas de aprendizaje automático supervisado y herramientas de inteligencia artificial generativa. Específicamente, se desarrolla un modelo predictivo basado en algoritmos de Gradient Boosting, utilizando como variables de entrada datos meteorológicos y el índice de claridad (Kt), parámetro derivado de la radiación solar, que permite clasificar la cobertura nubosa y mejorar la precisión del modelo. La radiación solar global horaria es la variable objetivo del sistema. El modelo con mejor desempeño, evaluado mediante métricas como el coeficiente de determinación (R²), error absoluto medio (MAE) y raíz del error cuadrático medio (RMSE), se integra en un chatbot interactivo diseñado para facilitar su uso y promover el acceso a  análisis exploratorios sin requerimientos técnicos por parte del usuario. Por ejemplo, un usuario puede consultar: “¿Cuál fue la radiación solar promedio en abril de 2022?” y obtener una respuesta acompañada de una visualización automática. Este sistema se implementa mediante la tecnología Semantic Kernel de Microsoft, que permite la ejecución de funciones programadas a partir de la interpretación del lenguaje natural, y se complementa con modelos de lenguaje locales gestionados a través de la plataforma Ollama, incluyendo instancias de LLaMA y Qwen. La solución propuesta mejora la precisión en la predicción de la radiación solar y facilita el acceso a modelos científicos mediante interfaces inteligentes y accesibles.
This short article presents a work in progress based on a hybrid approach for the estimation of hourly global solar radiation under variable sky conditions, combining supervised machine learning techniques and generative artificial intelligence tools. Specifically, a predictive model based on Gradient Boosting algorithms is developed, using as input variables meteorological data and the clarity index (Kt), a parameter derived from solar radiation, which allows classifying cloud cover and improving model accuracy. Hourly global solar radiation is the target variable of the system. The best performing model, evaluated using metrics such as the coefficient of determination (R²), mean absolute error (MAE) and root mean square error (RMSE), is integrated into an interactive chatbot designed to facilitate its use and promote access to exploratory analysis without technical requirements from the user. For example, a user can query: "What was the average solar radiation in April 2022?" and receive an answer accompanied by an automatic visualization. This system is implemented using Microsoft's Semantic Kernel technology, which enables the execution of programmed functions based on natural language interpretation, and is complemented by local language models managed through the Ollama platform, including instances of LLaMA and Qwen. The proposed solution improves the accuracy of solar radiation prediction and facilitates access to scientific models through intelligent and accessible interfaces.
Sociedad Argentina de Informática e Investigación Operativa
Materia
Ciencias Informáticas
Chatbot
LLM
Aprendizaje automático
machine learning
Radiación solar
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/190555

id SEDICI_008fb54c01f202645e19c669c24cb9e4
oai_identifier_str oai:sedici.unlp.edu.ar:10915/190555
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Desarrollo de un sistema multiagente basado en Modelos de Lenguaje Grande para la predicción de radiación solar utilizando datos meteorológicosDevelopment of a multi-agent system based on Large Language Models for solar radiation prediction using meteorological dataOlivera, LucasCappelletti, Marcelo ÁngelMorales, MartínCiencias InformáticasChatbotLLMAprendizaje automáticomachine learningRadiación solarEste artículo corto presenta un trabajo en desarrollo basado en un enfoque híbrido para la estimación de la radiación solar global horaria bajo condiciones de cielo variables, combinando técnicas de aprendizaje automático supervisado y herramientas de inteligencia artificial generativa. Específicamente, se desarrolla un modelo predictivo basado en algoritmos de Gradient Boosting, utilizando como variables de entrada datos meteorológicos y el índice de claridad (Kt), parámetro derivado de la radiación solar, que permite clasificar la cobertura nubosa y mejorar la precisión del modelo. La radiación solar global horaria es la variable objetivo del sistema. El modelo con mejor desempeño, evaluado mediante métricas como el coeficiente de determinación (R²), error absoluto medio (MAE) y raíz del error cuadrático medio (RMSE), se integra en un chatbot interactivo diseñado para facilitar su uso y promover el acceso a  análisis exploratorios sin requerimientos técnicos por parte del usuario. Por ejemplo, un usuario puede consultar: “¿Cuál fue la radiación solar promedio en abril de 2022?” y obtener una respuesta acompañada de una visualización automática. Este sistema se implementa mediante la tecnología Semantic Kernel de Microsoft, que permite la ejecución de funciones programadas a partir de la interpretación del lenguaje natural, y se complementa con modelos de lenguaje locales gestionados a través de la plataforma Ollama, incluyendo instancias de LLaMA y Qwen. La solución propuesta mejora la precisión en la predicción de la radiación solar y facilita el acceso a modelos científicos mediante interfaces inteligentes y accesibles.This short article presents a work in progress based on a hybrid approach for the estimation of hourly global solar radiation under variable sky conditions, combining supervised machine learning techniques and generative artificial intelligence tools. Specifically, a predictive model based on Gradient Boosting algorithms is developed, using as input variables meteorological data and the clarity index (Kt), a parameter derived from solar radiation, which allows classifying cloud cover and improving model accuracy. Hourly global solar radiation is the target variable of the system. The best performing model, evaluated using metrics such as the coefficient of determination (R²), mean absolute error (MAE) and root mean square error (RMSE), is integrated into an interactive chatbot designed to facilitate its use and promote access to exploratory analysis without technical requirements from the user. For example, a user can query: "What was the average solar radiation in April 2022?" and receive an answer accompanied by an automatic visualization. This system is implemented using Microsoft's Semantic Kernel technology, which enables the execution of programmed functions based on natural language interpretation, and is complemented by local language models managed through the Ollama platform, including instances of LLaMA and Qwen. The proposed solution improves the accuracy of solar radiation prediction and facilitates access to scientific models through intelligent and accessible interfaces.Sociedad Argentina de Informática e Investigación Operativa2025-08info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf119-123http://sedici.unlp.edu.ar/handle/10915/190555spainfo:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19772info:eu-repo/semantics/altIdentifier/issn/2451-7496info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-02-20T13:20:59Zoai:sedici.unlp.edu.ar:10915/190555Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-02-20 13:20:59.385SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Desarrollo de un sistema multiagente basado en Modelos de Lenguaje Grande para la predicción de radiación solar utilizando datos meteorológicos
Development of a multi-agent system based on Large Language Models for solar radiation prediction using meteorological data
title Desarrollo de un sistema multiagente basado en Modelos de Lenguaje Grande para la predicción de radiación solar utilizando datos meteorológicos
spellingShingle Desarrollo de un sistema multiagente basado en Modelos de Lenguaje Grande para la predicción de radiación solar utilizando datos meteorológicos
Olivera, Lucas
Ciencias Informáticas
Chatbot
LLM
Aprendizaje automático
machine learning
Radiación solar
title_short Desarrollo de un sistema multiagente basado en Modelos de Lenguaje Grande para la predicción de radiación solar utilizando datos meteorológicos
title_full Desarrollo de un sistema multiagente basado en Modelos de Lenguaje Grande para la predicción de radiación solar utilizando datos meteorológicos
title_fullStr Desarrollo de un sistema multiagente basado en Modelos de Lenguaje Grande para la predicción de radiación solar utilizando datos meteorológicos
title_full_unstemmed Desarrollo de un sistema multiagente basado en Modelos de Lenguaje Grande para la predicción de radiación solar utilizando datos meteorológicos
title_sort Desarrollo de un sistema multiagente basado en Modelos de Lenguaje Grande para la predicción de radiación solar utilizando datos meteorológicos
dc.creator.none.fl_str_mv Olivera, Lucas
Cappelletti, Marcelo Ángel
Morales, Martín
author Olivera, Lucas
author_facet Olivera, Lucas
Cappelletti, Marcelo Ángel
Morales, Martín
author_role author
author2 Cappelletti, Marcelo Ángel
Morales, Martín
author2_role author
author
dc.subject.none.fl_str_mv Ciencias Informáticas
Chatbot
LLM
Aprendizaje automático
machine learning
Radiación solar
topic Ciencias Informáticas
Chatbot
LLM
Aprendizaje automático
machine learning
Radiación solar
dc.description.none.fl_txt_mv Este artículo corto presenta un trabajo en desarrollo basado en un enfoque híbrido para la estimación de la radiación solar global horaria bajo condiciones de cielo variables, combinando técnicas de aprendizaje automático supervisado y herramientas de inteligencia artificial generativa. Específicamente, se desarrolla un modelo predictivo basado en algoritmos de Gradient Boosting, utilizando como variables de entrada datos meteorológicos y el índice de claridad (Kt), parámetro derivado de la radiación solar, que permite clasificar la cobertura nubosa y mejorar la precisión del modelo. La radiación solar global horaria es la variable objetivo del sistema. El modelo con mejor desempeño, evaluado mediante métricas como el coeficiente de determinación (R²), error absoluto medio (MAE) y raíz del error cuadrático medio (RMSE), se integra en un chatbot interactivo diseñado para facilitar su uso y promover el acceso a  análisis exploratorios sin requerimientos técnicos por parte del usuario. Por ejemplo, un usuario puede consultar: “¿Cuál fue la radiación solar promedio en abril de 2022?” y obtener una respuesta acompañada de una visualización automática. Este sistema se implementa mediante la tecnología Semantic Kernel de Microsoft, que permite la ejecución de funciones programadas a partir de la interpretación del lenguaje natural, y se complementa con modelos de lenguaje locales gestionados a través de la plataforma Ollama, incluyendo instancias de LLaMA y Qwen. La solución propuesta mejora la precisión en la predicción de la radiación solar y facilita el acceso a modelos científicos mediante interfaces inteligentes y accesibles.
This short article presents a work in progress based on a hybrid approach for the estimation of hourly global solar radiation under variable sky conditions, combining supervised machine learning techniques and generative artificial intelligence tools. Specifically, a predictive model based on Gradient Boosting algorithms is developed, using as input variables meteorological data and the clarity index (Kt), a parameter derived from solar radiation, which allows classifying cloud cover and improving model accuracy. Hourly global solar radiation is the target variable of the system. The best performing model, evaluated using metrics such as the coefficient of determination (R²), mean absolute error (MAE) and root mean square error (RMSE), is integrated into an interactive chatbot designed to facilitate its use and promote access to exploratory analysis without technical requirements from the user. For example, a user can query: "What was the average solar radiation in April 2022?" and receive an answer accompanied by an automatic visualization. This system is implemented using Microsoft's Semantic Kernel technology, which enables the execution of programmed functions based on natural language interpretation, and is complemented by local language models managed through the Ollama platform, including instances of LLaMA and Qwen. The proposed solution improves the accuracy of solar radiation prediction and facilitates access to scientific models through intelligent and accessible interfaces.
Sociedad Argentina de Informática e Investigación Operativa
description Este artículo corto presenta un trabajo en desarrollo basado en un enfoque híbrido para la estimación de la radiación solar global horaria bajo condiciones de cielo variables, combinando técnicas de aprendizaje automático supervisado y herramientas de inteligencia artificial generativa. Específicamente, se desarrolla un modelo predictivo basado en algoritmos de Gradient Boosting, utilizando como variables de entrada datos meteorológicos y el índice de claridad (Kt), parámetro derivado de la radiación solar, que permite clasificar la cobertura nubosa y mejorar la precisión del modelo. La radiación solar global horaria es la variable objetivo del sistema. El modelo con mejor desempeño, evaluado mediante métricas como el coeficiente de determinación (R²), error absoluto medio (MAE) y raíz del error cuadrático medio (RMSE), se integra en un chatbot interactivo diseñado para facilitar su uso y promover el acceso a  análisis exploratorios sin requerimientos técnicos por parte del usuario. Por ejemplo, un usuario puede consultar: “¿Cuál fue la radiación solar promedio en abril de 2022?” y obtener una respuesta acompañada de una visualización automática. Este sistema se implementa mediante la tecnología Semantic Kernel de Microsoft, que permite la ejecución de funciones programadas a partir de la interpretación del lenguaje natural, y se complementa con modelos de lenguaje locales gestionados a través de la plataforma Ollama, incluyendo instancias de LLaMA y Qwen. La solución propuesta mejora la precisión en la predicción de la radiación solar y facilita el acceso a modelos científicos mediante interfaces inteligentes y accesibles.
publishDate 2025
dc.date.none.fl_str_mv 2025-08
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/190555
url http://sedici.unlp.edu.ar/handle/10915/190555
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19772
info:eu-repo/semantics/altIdentifier/issn/2451-7496
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
119-123
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1857677062961102848
score 12.9253