Predicción de cristalización de perovskitas mediante aprendizaje automático

Autores
Ticona Oquendo, María Belén
Año de publicación
2023
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Onna, Diego Ariel
Turjanski, Pablo Guillermo
Descripción
La ciencia de los materiales es un área de estudio interdisciplinar en el que tradicionalmente se descubren materiales mediante la prueba y error experimental en el laboratorio. Descubrir un nuevo material suele llevar varios años de investigación, así como también una considerable cantidad de recursos e inversiones. Actualmente, uno de los materiales más investigados son las perovskitas por ser una promesa en el desarrollo de paneles solares. Si bien existen múltiples maneras de sintetizarlas, se destaca en particular la técnica de cristalización debido a que permite obtener una caracterización detallada de su composición y estructura química, entre otros motivos. Sin embargo, debido a la sensibilidad de este proceso químico, es difícil conocer en qué condiciones experimentales se produce la cristalización. De allí que el uso del tradicional mecanismo de prueba y error experimental suela generar datos en los que mayoritariamente no cristaliza la perovskita. En este contexto, existen trabajos que han demostrado que es posible desarrollar modelos de predicción de cristalización de perovskitas empleando técnicas de aprendizaje automático, usando datos ya recolectados sobre experimentaciones de síntesis de cristales. No obstante, desde un punto de vista metodológico, estos modelos se han realizado sin considerar las características que conlleva usar datos experimentales, como por ejemplo, la cantidad acotada de datos, el desbalance entre experimentaciones en donde efectivamente
Material science is an interdisciplinary field that generally discovers new materials through trial and error in the lab. Discovering new materials usually takes several years of research, as well as a considerable amount of resources and investments. Currently, one of the most relevant materials are perovskites, as they hold great promise for the development of solar cells. The crystallization mechanism is the most relevant method to synthesize perovskites as it allows a detailed (compositional and chemical) characterization of the material structure, among the different methods. However, because of the sensitivity of the crystallization process, experimental conditions that produce pervoskite crystals are hardly discovered. Hence,the experimental trial and error process usually results in imbalanced data (where most experiments do not produce crystals). In this context, studies have shown that it is possible to develop classification models that predict perovskite crystallization using data collected in laboratory experiments. However, from a methodological point of view, these models have been developed without considering the characteristics of using experimental data (such as the limited data available, class imbalances, biases in data collection, among others). In this work, we studied model evaluation sensitivity to errors in data collection and experimental data sampling. Therefore, we analyzed how traditional classification metrics behave, using synthetic confusion matrices, when small and imbalance datasets are used. We proposed an alternative evaluation method, based on a bidimensional representation of two complementary metrics, which makes it easier to distinguish model performance. Finally, we applied this method to study ensamble models for small datasets, concluding that the combination of specialized models in different classes produces high-performance models. Keywords: perovskite, crystallization, machine learning, imbalance, ensamble
Fil: Ticona Oquendo, María Belén. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
PEROVSKITA
CRISTALIZACION
APRENDIZAJE AUTOMATICO
DESBALANCE
ENSAMBLES
PEROVSKITE
CRYSTALLIZATION
MACHINE LEARNING
IMBALANCE
ENSAMBLE
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
seminario:seminario_nCOM000543_Ticona

id BDUBAFCEN_0554601955c7f799c0d5685c55c1e0d0
oai_identifier_str seminario:seminario_nCOM000543_Ticona
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Predicción de cristalización de perovskitas mediante aprendizaje automáticoTicona Oquendo, María BelénPEROVSKITACRISTALIZACIONAPRENDIZAJE AUTOMATICODESBALANCEENSAMBLESPEROVSKITECRYSTALLIZATIONMACHINE LEARNINGIMBALANCEENSAMBLELa ciencia de los materiales es un área de estudio interdisciplinar en el que tradicionalmente se descubren materiales mediante la prueba y error experimental en el laboratorio. Descubrir un nuevo material suele llevar varios años de investigación, así como también una considerable cantidad de recursos e inversiones. Actualmente, uno de los materiales más investigados son las perovskitas por ser una promesa en el desarrollo de paneles solares. Si bien existen múltiples maneras de sintetizarlas, se destaca en particular la técnica de cristalización debido a que permite obtener una caracterización detallada de su composición y estructura química, entre otros motivos. Sin embargo, debido a la sensibilidad de este proceso químico, es difícil conocer en qué condiciones experimentales se produce la cristalización. De allí que el uso del tradicional mecanismo de prueba y error experimental suela generar datos en los que mayoritariamente no cristaliza la perovskita. En este contexto, existen trabajos que han demostrado que es posible desarrollar modelos de predicción de cristalización de perovskitas empleando técnicas de aprendizaje automático, usando datos ya recolectados sobre experimentaciones de síntesis de cristales. No obstante, desde un punto de vista metodológico, estos modelos se han realizado sin considerar las características que conlleva usar datos experimentales, como por ejemplo, la cantidad acotada de datos, el desbalance entre experimentaciones en donde efectivamenteMaterial science is an interdisciplinary field that generally discovers new materials through trial and error in the lab. Discovering new materials usually takes several years of research, as well as a considerable amount of resources and investments. Currently, one of the most relevant materials are perovskites, as they hold great promise for the development of solar cells. The crystallization mechanism is the most relevant method to synthesize perovskites as it allows a detailed (compositional and chemical) characterization of the material structure, among the different methods. However, because of the sensitivity of the crystallization process, experimental conditions that produce pervoskite crystals are hardly discovered. Hence,the experimental trial and error process usually results in imbalanced data (where most experiments do not produce crystals). In this context, studies have shown that it is possible to develop classification models that predict perovskite crystallization using data collected in laboratory experiments. However, from a methodological point of view, these models have been developed without considering the characteristics of using experimental data (such as the limited data available, class imbalances, biases in data collection, among others). In this work, we studied model evaluation sensitivity to errors in data collection and experimental data sampling. Therefore, we analyzed how traditional classification metrics behave, using synthetic confusion matrices, when small and imbalance datasets are used. We proposed an alternative evaluation method, based on a bidimensional representation of two complementary metrics, which makes it easier to distinguish model performance. Finally, we applied this method to study ensamble models for small datasets, concluding that the combination of specialized models in different classes produces high-performance models. Keywords: perovskite, crystallization, machine learning, imbalance, ensambleFil: Ticona Oquendo, María Belén. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesOnna, Diego ArielTurjanski, Pablo Guillermo2023info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000543_Ticonaspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-10-16T09:31:07Zseminario:seminario_nCOM000543_TiconaInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-10-16 09:31:08.551Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Predicción de cristalización de perovskitas mediante aprendizaje automático
title Predicción de cristalización de perovskitas mediante aprendizaje automático
spellingShingle Predicción de cristalización de perovskitas mediante aprendizaje automático
Ticona Oquendo, María Belén
PEROVSKITA
CRISTALIZACION
APRENDIZAJE AUTOMATICO
DESBALANCE
ENSAMBLES
PEROVSKITE
CRYSTALLIZATION
MACHINE LEARNING
IMBALANCE
ENSAMBLE
title_short Predicción de cristalización de perovskitas mediante aprendizaje automático
title_full Predicción de cristalización de perovskitas mediante aprendizaje automático
title_fullStr Predicción de cristalización de perovskitas mediante aprendizaje automático
title_full_unstemmed Predicción de cristalización de perovskitas mediante aprendizaje automático
title_sort Predicción de cristalización de perovskitas mediante aprendizaje automático
dc.creator.none.fl_str_mv Ticona Oquendo, María Belén
author Ticona Oquendo, María Belén
author_facet Ticona Oquendo, María Belén
author_role author
dc.contributor.none.fl_str_mv Onna, Diego Ariel
Turjanski, Pablo Guillermo
dc.subject.none.fl_str_mv PEROVSKITA
CRISTALIZACION
APRENDIZAJE AUTOMATICO
DESBALANCE
ENSAMBLES
PEROVSKITE
CRYSTALLIZATION
MACHINE LEARNING
IMBALANCE
ENSAMBLE
topic PEROVSKITA
CRISTALIZACION
APRENDIZAJE AUTOMATICO
DESBALANCE
ENSAMBLES
PEROVSKITE
CRYSTALLIZATION
MACHINE LEARNING
IMBALANCE
ENSAMBLE
dc.description.none.fl_txt_mv La ciencia de los materiales es un área de estudio interdisciplinar en el que tradicionalmente se descubren materiales mediante la prueba y error experimental en el laboratorio. Descubrir un nuevo material suele llevar varios años de investigación, así como también una considerable cantidad de recursos e inversiones. Actualmente, uno de los materiales más investigados son las perovskitas por ser una promesa en el desarrollo de paneles solares. Si bien existen múltiples maneras de sintetizarlas, se destaca en particular la técnica de cristalización debido a que permite obtener una caracterización detallada de su composición y estructura química, entre otros motivos. Sin embargo, debido a la sensibilidad de este proceso químico, es difícil conocer en qué condiciones experimentales se produce la cristalización. De allí que el uso del tradicional mecanismo de prueba y error experimental suela generar datos en los que mayoritariamente no cristaliza la perovskita. En este contexto, existen trabajos que han demostrado que es posible desarrollar modelos de predicción de cristalización de perovskitas empleando técnicas de aprendizaje automático, usando datos ya recolectados sobre experimentaciones de síntesis de cristales. No obstante, desde un punto de vista metodológico, estos modelos se han realizado sin considerar las características que conlleva usar datos experimentales, como por ejemplo, la cantidad acotada de datos, el desbalance entre experimentaciones en donde efectivamente
Material science is an interdisciplinary field that generally discovers new materials through trial and error in the lab. Discovering new materials usually takes several years of research, as well as a considerable amount of resources and investments. Currently, one of the most relevant materials are perovskites, as they hold great promise for the development of solar cells. The crystallization mechanism is the most relevant method to synthesize perovskites as it allows a detailed (compositional and chemical) characterization of the material structure, among the different methods. However, because of the sensitivity of the crystallization process, experimental conditions that produce pervoskite crystals are hardly discovered. Hence,the experimental trial and error process usually results in imbalanced data (where most experiments do not produce crystals). In this context, studies have shown that it is possible to develop classification models that predict perovskite crystallization using data collected in laboratory experiments. However, from a methodological point of view, these models have been developed without considering the characteristics of using experimental data (such as the limited data available, class imbalances, biases in data collection, among others). In this work, we studied model evaluation sensitivity to errors in data collection and experimental data sampling. Therefore, we analyzed how traditional classification metrics behave, using synthetic confusion matrices, when small and imbalance datasets are used. We proposed an alternative evaluation method, based on a bidimensional representation of two complementary metrics, which makes it easier to distinguish model performance. Finally, we applied this method to study ensamble models for small datasets, concluding that the combination of specialized models in different classes produces high-performance models. Keywords: perovskite, crystallization, machine learning, imbalance, ensamble
Fil: Ticona Oquendo, María Belén. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description La ciencia de los materiales es un área de estudio interdisciplinar en el que tradicionalmente se descubren materiales mediante la prueba y error experimental en el laboratorio. Descubrir un nuevo material suele llevar varios años de investigación, así como también una considerable cantidad de recursos e inversiones. Actualmente, uno de los materiales más investigados son las perovskitas por ser una promesa en el desarrollo de paneles solares. Si bien existen múltiples maneras de sintetizarlas, se destaca en particular la técnica de cristalización debido a que permite obtener una caracterización detallada de su composición y estructura química, entre otros motivos. Sin embargo, debido a la sensibilidad de este proceso químico, es difícil conocer en qué condiciones experimentales se produce la cristalización. De allí que el uso del tradicional mecanismo de prueba y error experimental suela generar datos en los que mayoritariamente no cristaliza la perovskita. En este contexto, existen trabajos que han demostrado que es posible desarrollar modelos de predicción de cristalización de perovskitas empleando técnicas de aprendizaje automático, usando datos ya recolectados sobre experimentaciones de síntesis de cristales. No obstante, desde un punto de vista metodológico, estos modelos se han realizado sin considerar las características que conlleva usar datos experimentales, como por ejemplo, la cantidad acotada de datos, el desbalance entre experimentaciones en donde efectivamente
publishDate 2023
dc.date.none.fl_str_mv 2023
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/seminario_nCOM000543_Ticona
url https://hdl.handle.net/20.500.12110/seminario_nCOM000543_Ticona
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1846142861892911104
score 12.712165