Modelos de puntuación basados en aprendizaje automático para calcular el scoring de empresas
- Autores
- Trucco, Martín Gabriel
- Año de publicación
- 2024
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Giuliodori, David Augusto
Tamarit, Francisco Antonio - Descripción
- Tesis (Lic. en Física)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024.
Fil: Trucco, Martín Gabriel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
El scoring bancario es una herramienta esencial para facilitar la toma de decisiones en instituciones financieras, ya que permite determinar si es factible hacer entrega del crédito o financiamiento solicitado por parte de individuos o personas jurı́dicas. En consecuencia, este trabajo tiene como objetivo predecir la capacidad de pago de empresas nacionales, analizando bases de datos públicas y anonimizadas correspondientes a 51.141 firmas, con datos recopilados durante 49 meses consecutivos. Debido a la importancia de la dimensión temporal en este tipo de problemas, se adopta un enfoque basado en series temporales y se aplican tres arquitecturas de aprendizaje automático: regresión logı́stica, Random Forest de clasificación y redes neuronales recurrentes LSTM. La evaluación del rendimiento de los modelos se realiza mediante diversas métricas e indi- cadores como la sensibilidad, exactitud o curvas ROC, que proporcionan información valiosa para identificar el método con mejor desempeño. Los resultados reflejan una alta efectividad en general, siendo el clasificador Random Forest predominante, lo que destaca la relevancia actual del aprendizaje automático en el ámbito económico.
Bank scoring is an essential tool to facilitate the decision-making in financial institutions, as it allows determining whether it is feasible to grant the requested credit or loan to individuals or legal entities. Consequently, this work aims to predict the default capacity of national companies, analyzing public and anonymized databases corresponding to 51.141 firms, with data collected over 49 consecutive months. Due to the importance of the time dimension in this type of problems, a time series-based approach is adopted, and three machine learning architectures are applied: logistic regression, Random Forest classifier and LSTM recurrent neural networks. The performance evaluation of the models is carried out using various metrics and indicators such as recall, accuracy or ROC curves, which provide valuable information to identify the best method. The results reflect a high effectiveness overall, with the Random Forest classifier being predominant, highlighting the current relevance of machine learning in the economic domain.
Fil: Trucco, Martín Gabriel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. - Materia
-
Inteligencia artificial
Redes neuronales
Series temporales
Análisis de datos
Riesgo crediticio
Scoring bancario
Aprendizaje automático
Machine learning
Neural networks
Time series
Data analysis
Credit scoring
Credit risk - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- Repositorio
- Institución
- Universidad Nacional de Córdoba
- OAI Identificador
- oai:rdu.unc.edu.ar:11086/552428
Ver los metadatos del registro completo
id |
RDUUNC_a261426a4a3e0a57f63a373dfd4df712 |
---|---|
oai_identifier_str |
oai:rdu.unc.edu.ar:11086/552428 |
network_acronym_str |
RDUUNC |
repository_id_str |
2572 |
network_name_str |
Repositorio Digital Universitario (UNC) |
spelling |
Modelos de puntuación basados en aprendizaje automático para calcular el scoring de empresasTrucco, Martín GabrielInteligencia artificialRedes neuronalesSeries temporalesAnálisis de datosRiesgo crediticioScoring bancarioAprendizaje automáticoMachine learningNeural networksTime seriesData analysisCredit scoringCredit riskTesis (Lic. en Física)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024.Fil: Trucco, Martín Gabriel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.El scoring bancario es una herramienta esencial para facilitar la toma de decisiones en instituciones financieras, ya que permite determinar si es factible hacer entrega del crédito o financiamiento solicitado por parte de individuos o personas jurı́dicas. En consecuencia, este trabajo tiene como objetivo predecir la capacidad de pago de empresas nacionales, analizando bases de datos públicas y anonimizadas correspondientes a 51.141 firmas, con datos recopilados durante 49 meses consecutivos. Debido a la importancia de la dimensión temporal en este tipo de problemas, se adopta un enfoque basado en series temporales y se aplican tres arquitecturas de aprendizaje automático: regresión logı́stica, Random Forest de clasificación y redes neuronales recurrentes LSTM. La evaluación del rendimiento de los modelos se realiza mediante diversas métricas e indi- cadores como la sensibilidad, exactitud o curvas ROC, que proporcionan información valiosa para identificar el método con mejor desempeño. Los resultados reflejan una alta efectividad en general, siendo el clasificador Random Forest predominante, lo que destaca la relevancia actual del aprendizaje automático en el ámbito económico.Bank scoring is an essential tool to facilitate the decision-making in financial institutions, as it allows determining whether it is feasible to grant the requested credit or loan to individuals or legal entities. Consequently, this work aims to predict the default capacity of national companies, analyzing public and anonymized databases corresponding to 51.141 firms, with data collected over 49 consecutive months. Due to the importance of the time dimension in this type of problems, a time series-based approach is adopted, and three machine learning architectures are applied: logistic regression, Random Forest classifier and LSTM recurrent neural networks. The performance evaluation of the models is carried out using various metrics and indicators such as recall, accuracy or ROC curves, which provide valuable information to identify the best method. The results reflect a high effectiveness overall, with the Random Forest classifier being predominant, highlighting the current relevance of machine learning in the economic domain.Fil: Trucco, Martín Gabriel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.Giuliodori, David AugustoTamarit, Francisco Antonio2024-05-03info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/552428spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-09-29T13:42:05Zoai:rdu.unc.edu.ar:11086/552428Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-09-29 13:42:05.571Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse |
dc.title.none.fl_str_mv |
Modelos de puntuación basados en aprendizaje automático para calcular el scoring de empresas |
title |
Modelos de puntuación basados en aprendizaje automático para calcular el scoring de empresas |
spellingShingle |
Modelos de puntuación basados en aprendizaje automático para calcular el scoring de empresas Trucco, Martín Gabriel Inteligencia artificial Redes neuronales Series temporales Análisis de datos Riesgo crediticio Scoring bancario Aprendizaje automático Machine learning Neural networks Time series Data analysis Credit scoring Credit risk |
title_short |
Modelos de puntuación basados en aprendizaje automático para calcular el scoring de empresas |
title_full |
Modelos de puntuación basados en aprendizaje automático para calcular el scoring de empresas |
title_fullStr |
Modelos de puntuación basados en aprendizaje automático para calcular el scoring de empresas |
title_full_unstemmed |
Modelos de puntuación basados en aprendizaje automático para calcular el scoring de empresas |
title_sort |
Modelos de puntuación basados en aprendizaje automático para calcular el scoring de empresas |
dc.creator.none.fl_str_mv |
Trucco, Martín Gabriel |
author |
Trucco, Martín Gabriel |
author_facet |
Trucco, Martín Gabriel |
author_role |
author |
dc.contributor.none.fl_str_mv |
Giuliodori, David Augusto Tamarit, Francisco Antonio |
dc.subject.none.fl_str_mv |
Inteligencia artificial Redes neuronales Series temporales Análisis de datos Riesgo crediticio Scoring bancario Aprendizaje automático Machine learning Neural networks Time series Data analysis Credit scoring Credit risk |
topic |
Inteligencia artificial Redes neuronales Series temporales Análisis de datos Riesgo crediticio Scoring bancario Aprendizaje automático Machine learning Neural networks Time series Data analysis Credit scoring Credit risk |
dc.description.none.fl_txt_mv |
Tesis (Lic. en Física)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024. Fil: Trucco, Martín Gabriel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. El scoring bancario es una herramienta esencial para facilitar la toma de decisiones en instituciones financieras, ya que permite determinar si es factible hacer entrega del crédito o financiamiento solicitado por parte de individuos o personas jurı́dicas. En consecuencia, este trabajo tiene como objetivo predecir la capacidad de pago de empresas nacionales, analizando bases de datos públicas y anonimizadas correspondientes a 51.141 firmas, con datos recopilados durante 49 meses consecutivos. Debido a la importancia de la dimensión temporal en este tipo de problemas, se adopta un enfoque basado en series temporales y se aplican tres arquitecturas de aprendizaje automático: regresión logı́stica, Random Forest de clasificación y redes neuronales recurrentes LSTM. La evaluación del rendimiento de los modelos se realiza mediante diversas métricas e indi- cadores como la sensibilidad, exactitud o curvas ROC, que proporcionan información valiosa para identificar el método con mejor desempeño. Los resultados reflejan una alta efectividad en general, siendo el clasificador Random Forest predominante, lo que destaca la relevancia actual del aprendizaje automático en el ámbito económico. Bank scoring is an essential tool to facilitate the decision-making in financial institutions, as it allows determining whether it is feasible to grant the requested credit or loan to individuals or legal entities. Consequently, this work aims to predict the default capacity of national companies, analyzing public and anonymized databases corresponding to 51.141 firms, with data collected over 49 consecutive months. Due to the importance of the time dimension in this type of problems, a time series-based approach is adopted, and three machine learning architectures are applied: logistic regression, Random Forest classifier and LSTM recurrent neural networks. The performance evaluation of the models is carried out using various metrics and indicators such as recall, accuracy or ROC curves, which provide valuable information to identify the best method. The results reflect a high effectiveness overall, with the Random Forest classifier being predominant, highlighting the current relevance of machine learning in the economic domain. Fil: Trucco, Martín Gabriel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. |
description |
Tesis (Lic. en Física)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024. |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2024-05-03 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://hdl.handle.net/11086/552428 |
url |
http://hdl.handle.net/11086/552428 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositorio Digital Universitario (UNC) instname:Universidad Nacional de Córdoba instacron:UNC |
reponame_str |
Repositorio Digital Universitario (UNC) |
collection |
Repositorio Digital Universitario (UNC) |
instname_str |
Universidad Nacional de Córdoba |
instacron_str |
UNC |
institution |
UNC |
repository.name.fl_str_mv |
Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba |
repository.mail.fl_str_mv |
oca.unc@gmail.com |
_version_ |
1844618918223675392 |
score |
13.070432 |