Modelos de puntuación basados en aprendizaje automático para calcular el scoring de empresas

Autores
Trucco, Martín Gabriel
Año de publicación
2024
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Giuliodori, David Augusto
Tamarit, Francisco Antonio
Descripción
Tesis (Lic. en Física)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024.
Fil: Trucco, Martín Gabriel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
El scoring bancario es una herramienta esencial para facilitar la toma de decisiones en instituciones financieras, ya que permite determinar si es factible hacer entrega del crédito o financiamiento solicitado por parte de individuos o personas jurı́dicas. En consecuencia, este trabajo tiene como objetivo predecir la capacidad de pago de empresas nacionales, analizando bases de datos públicas y anonimizadas correspondientes a 51.141 firmas, con datos recopilados durante 49 meses consecutivos. Debido a la importancia de la dimensión temporal en este tipo de problemas, se adopta un enfoque basado en series temporales y se aplican tres arquitecturas de aprendizaje automático: regresión logı́stica, Random Forest de clasificación y redes neuronales recurrentes LSTM. La evaluación del rendimiento de los modelos se realiza mediante diversas métricas e indi- cadores como la sensibilidad, exactitud o curvas ROC, que proporcionan información valiosa para identificar el método con mejor desempeño. Los resultados reflejan una alta efectividad en general, siendo el clasificador Random Forest predominante, lo que destaca la relevancia actual del aprendizaje automático en el ámbito económico.
Bank scoring is an essential tool to facilitate the decision-making in financial institutions, as it allows determining whether it is feasible to grant the requested credit or loan to individuals or legal entities. Consequently, this work aims to predict the default capacity of national companies, analyzing public and anonymized databases corresponding to 51.141 firms, with data collected over 49 consecutive months. Due to the importance of the time dimension in this type of problems, a time series-based approach is adopted, and three machine learning architectures are applied: logistic regression, Random Forest classifier and LSTM recurrent neural networks. The performance evaluation of the models is carried out using various metrics and indicators such as recall, accuracy or ROC curves, which provide valuable information to identify the best method. The results reflect a high effectiveness overall, with the Random Forest classifier being predominant, highlighting the current relevance of machine learning in the economic domain.
Fil: Trucco, Martín Gabriel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Materia
Inteligencia artificial
Redes neuronales
Series temporales
Análisis de datos
Riesgo crediticio
Scoring bancario
Aprendizaje automático
Machine learning
Neural networks
Time series
Data analysis
Credit scoring
Credit risk
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Repositorio
Repositorio Digital Universitario (UNC)
Institución
Universidad Nacional de Córdoba
OAI Identificador
oai:rdu.unc.edu.ar:11086/552428

id RDUUNC_a261426a4a3e0a57f63a373dfd4df712
oai_identifier_str oai:rdu.unc.edu.ar:11086/552428
network_acronym_str RDUUNC
repository_id_str 2572
network_name_str Repositorio Digital Universitario (UNC)
spelling Modelos de puntuación basados en aprendizaje automático para calcular el scoring de empresasTrucco, Martín GabrielInteligencia artificialRedes neuronalesSeries temporalesAnálisis de datosRiesgo crediticioScoring bancarioAprendizaje automáticoMachine learningNeural networksTime seriesData analysisCredit scoringCredit riskTesis (Lic. en Física)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024.Fil: Trucco, Martín Gabriel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.El scoring bancario es una herramienta esencial para facilitar la toma de decisiones en instituciones financieras, ya que permite determinar si es factible hacer entrega del crédito o financiamiento solicitado por parte de individuos o personas jurı́dicas. En consecuencia, este trabajo tiene como objetivo predecir la capacidad de pago de empresas nacionales, analizando bases de datos públicas y anonimizadas correspondientes a 51.141 firmas, con datos recopilados durante 49 meses consecutivos. Debido a la importancia de la dimensión temporal en este tipo de problemas, se adopta un enfoque basado en series temporales y se aplican tres arquitecturas de aprendizaje automático: regresión logı́stica, Random Forest de clasificación y redes neuronales recurrentes LSTM. La evaluación del rendimiento de los modelos se realiza mediante diversas métricas e indi- cadores como la sensibilidad, exactitud o curvas ROC, que proporcionan información valiosa para identificar el método con mejor desempeño. Los resultados reflejan una alta efectividad en general, siendo el clasificador Random Forest predominante, lo que destaca la relevancia actual del aprendizaje automático en el ámbito económico.Bank scoring is an essential tool to facilitate the decision-making in financial institutions, as it allows determining whether it is feasible to grant the requested credit or loan to individuals or legal entities. Consequently, this work aims to predict the default capacity of national companies, analyzing public and anonymized databases corresponding to 51.141 firms, with data collected over 49 consecutive months. Due to the importance of the time dimension in this type of problems, a time series-based approach is adopted, and three machine learning architectures are applied: logistic regression, Random Forest classifier and LSTM recurrent neural networks. The performance evaluation of the models is carried out using various metrics and indicators such as recall, accuracy or ROC curves, which provide valuable information to identify the best method. The results reflect a high effectiveness overall, with the Random Forest classifier being predominant, highlighting the current relevance of machine learning in the economic domain.Fil: Trucco, Martín Gabriel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.Giuliodori, David AugustoTamarit, Francisco Antonio2024-05-03info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/552428spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-09-29T13:42:05Zoai:rdu.unc.edu.ar:11086/552428Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-09-29 13:42:05.571Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv Modelos de puntuación basados en aprendizaje automático para calcular el scoring de empresas
title Modelos de puntuación basados en aprendizaje automático para calcular el scoring de empresas
spellingShingle Modelos de puntuación basados en aprendizaje automático para calcular el scoring de empresas
Trucco, Martín Gabriel
Inteligencia artificial
Redes neuronales
Series temporales
Análisis de datos
Riesgo crediticio
Scoring bancario
Aprendizaje automático
Machine learning
Neural networks
Time series
Data analysis
Credit scoring
Credit risk
title_short Modelos de puntuación basados en aprendizaje automático para calcular el scoring de empresas
title_full Modelos de puntuación basados en aprendizaje automático para calcular el scoring de empresas
title_fullStr Modelos de puntuación basados en aprendizaje automático para calcular el scoring de empresas
title_full_unstemmed Modelos de puntuación basados en aprendizaje automático para calcular el scoring de empresas
title_sort Modelos de puntuación basados en aprendizaje automático para calcular el scoring de empresas
dc.creator.none.fl_str_mv Trucco, Martín Gabriel
author Trucco, Martín Gabriel
author_facet Trucco, Martín Gabriel
author_role author
dc.contributor.none.fl_str_mv Giuliodori, David Augusto
Tamarit, Francisco Antonio
dc.subject.none.fl_str_mv Inteligencia artificial
Redes neuronales
Series temporales
Análisis de datos
Riesgo crediticio
Scoring bancario
Aprendizaje automático
Machine learning
Neural networks
Time series
Data analysis
Credit scoring
Credit risk
topic Inteligencia artificial
Redes neuronales
Series temporales
Análisis de datos
Riesgo crediticio
Scoring bancario
Aprendizaje automático
Machine learning
Neural networks
Time series
Data analysis
Credit scoring
Credit risk
dc.description.none.fl_txt_mv Tesis (Lic. en Física)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024.
Fil: Trucco, Martín Gabriel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
El scoring bancario es una herramienta esencial para facilitar la toma de decisiones en instituciones financieras, ya que permite determinar si es factible hacer entrega del crédito o financiamiento solicitado por parte de individuos o personas jurı́dicas. En consecuencia, este trabajo tiene como objetivo predecir la capacidad de pago de empresas nacionales, analizando bases de datos públicas y anonimizadas correspondientes a 51.141 firmas, con datos recopilados durante 49 meses consecutivos. Debido a la importancia de la dimensión temporal en este tipo de problemas, se adopta un enfoque basado en series temporales y se aplican tres arquitecturas de aprendizaje automático: regresión logı́stica, Random Forest de clasificación y redes neuronales recurrentes LSTM. La evaluación del rendimiento de los modelos se realiza mediante diversas métricas e indi- cadores como la sensibilidad, exactitud o curvas ROC, que proporcionan información valiosa para identificar el método con mejor desempeño. Los resultados reflejan una alta efectividad en general, siendo el clasificador Random Forest predominante, lo que destaca la relevancia actual del aprendizaje automático en el ámbito económico.
Bank scoring is an essential tool to facilitate the decision-making in financial institutions, as it allows determining whether it is feasible to grant the requested credit or loan to individuals or legal entities. Consequently, this work aims to predict the default capacity of national companies, analyzing public and anonymized databases corresponding to 51.141 firms, with data collected over 49 consecutive months. Due to the importance of the time dimension in this type of problems, a time series-based approach is adopted, and three machine learning architectures are applied: logistic regression, Random Forest classifier and LSTM recurrent neural networks. The performance evaluation of the models is carried out using various metrics and indicators such as recall, accuracy or ROC curves, which provide valuable information to identify the best method. The results reflect a high effectiveness overall, with the Random Forest classifier being predominant, highlighting the current relevance of machine learning in the economic domain.
Fil: Trucco, Martín Gabriel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
description Tesis (Lic. en Física)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024.
publishDate 2024
dc.date.none.fl_str_mv 2024-05-03
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11086/552428
url http://hdl.handle.net/11086/552428
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositorio Digital Universitario (UNC)
instname:Universidad Nacional de Córdoba
instacron:UNC
reponame_str Repositorio Digital Universitario (UNC)
collection Repositorio Digital Universitario (UNC)
instname_str Universidad Nacional de Córdoba
instacron_str UNC
institution UNC
repository.name.fl_str_mv Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv oca.unc@gmail.com
_version_ 1844618918223675392
score 13.070432