Predicción de cristalización de perovskitas mediante aprendizaje automático
- Autores
- Ticona Oquendo, María Belén
- Año de publicación
- 2023
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Onna, Diego Ariel
Turjanski, Pablo Guillermo - Descripción
- La ciencia de los materiales es un área de estudio interdisciplinar en el que tradicionalmente se descubren materiales mediante la prueba y error experimental en el laboratorio. Descubrir un nuevo material suele llevar varios años de investigación, así como también una considerable cantidad de recursos e inversiones. Actualmente, uno de los materiales más investigados son las perovskitas por ser una promesa en el desarrollo de paneles solares. Si bien existen múltiples maneras de sintetizarlas, se destaca en particular la técnica de cristalización debido a que permite obtener una caracterización detallada de su composición y estructura química, entre otros motivos. Sin embargo, debido a la sensibilidad de este proceso químico, es difícil conocer en qué condiciones experimentales se produce la cristalización. De allí que el uso del tradicional mecanismo de prueba y error experimental suela generar datos en los que mayoritariamente no cristaliza la perovskita. En este contexto, existen trabajos que han demostrado que es posible desarrollar modelos de predicción de cristalización de perovskitas empleando técnicas de aprendizaje automático, usando datos ya recolectados sobre experimentaciones de síntesis de cristales. No obstante, desde un punto de vista metodológico, estos modelos se han realizado sin considerar las características que conlleva usar datos experimentales, como por ejemplo, la cantidad acotada de datos, el desbalance entre experimentaciones en donde efectivamente
Material science is an interdisciplinary field that generally discovers new materials through trial and error in the lab. Discovering new materials usually takes several years of research, as well as a considerable amount of resources and investments. Currently, one of the most relevant materials are perovskites, as they hold great promise for the development of solar cells. The crystallization mechanism is the most relevant method to synthesize perovskites as it allows a detailed (compositional and chemical) characterization of the material structure, among the different methods. However, because of the sensitivity of the crystallization process, experimental conditions that produce pervoskite crystals are hardly discovered. Hence,the experimental trial and error process usually results in imbalanced data (where most experiments do not produce crystals). In this context, studies have shown that it is possible to develop classification models that predict perovskite crystallization using data collected in laboratory experiments. However, from a methodological point of view, these models have been developed without considering the characteristics of using experimental data (such as the limited data available, class imbalances, biases in data collection, among others). In this work, we studied model evaluation sensitivity to errors in data collection and experimental data sampling. Therefore, we analyzed how traditional classification metrics behave, using synthetic confusion matrices, when small and imbalance datasets are used. We proposed an alternative evaluation method, based on a bidimensional representation of two complementary metrics, which makes it easier to distinguish model performance. Finally, we applied this method to study ensamble models for small datasets, concluding that the combination of specialized models in different classes produces high-performance models. Keywords: perovskite, crystallization, machine learning, imbalance, ensamble
Fil: Ticona Oquendo, María Belén. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. - Materia
-
PEROVSKITA
CRISTALIZACION
APRENDIZAJE AUTOMATICO
DESBALANCE
ENSAMBLES
PEROVSKITE
CRYSTALLIZATION
MACHINE LEARNING
IMBALANCE
ENSAMBLE - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar
- Repositorio
- Institución
- Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
- OAI Identificador
- seminario:seminario_nCOM000543_Ticona
Ver los metadatos del registro completo
id |
BDUBAFCEN_0554601955c7f799c0d5685c55c1e0d0 |
---|---|
oai_identifier_str |
seminario:seminario_nCOM000543_Ticona |
network_acronym_str |
BDUBAFCEN |
repository_id_str |
1896 |
network_name_str |
Biblioteca Digital (UBA-FCEN) |
spelling |
Predicción de cristalización de perovskitas mediante aprendizaje automáticoTicona Oquendo, María BelénPEROVSKITACRISTALIZACIONAPRENDIZAJE AUTOMATICODESBALANCEENSAMBLESPEROVSKITECRYSTALLIZATIONMACHINE LEARNINGIMBALANCEENSAMBLELa ciencia de los materiales es un área de estudio interdisciplinar en el que tradicionalmente se descubren materiales mediante la prueba y error experimental en el laboratorio. Descubrir un nuevo material suele llevar varios años de investigación, así como también una considerable cantidad de recursos e inversiones. Actualmente, uno de los materiales más investigados son las perovskitas por ser una promesa en el desarrollo de paneles solares. Si bien existen múltiples maneras de sintetizarlas, se destaca en particular la técnica de cristalización debido a que permite obtener una caracterización detallada de su composición y estructura química, entre otros motivos. Sin embargo, debido a la sensibilidad de este proceso químico, es difícil conocer en qué condiciones experimentales se produce la cristalización. De allí que el uso del tradicional mecanismo de prueba y error experimental suela generar datos en los que mayoritariamente no cristaliza la perovskita. En este contexto, existen trabajos que han demostrado que es posible desarrollar modelos de predicción de cristalización de perovskitas empleando técnicas de aprendizaje automático, usando datos ya recolectados sobre experimentaciones de síntesis de cristales. No obstante, desde un punto de vista metodológico, estos modelos se han realizado sin considerar las características que conlleva usar datos experimentales, como por ejemplo, la cantidad acotada de datos, el desbalance entre experimentaciones en donde efectivamenteMaterial science is an interdisciplinary field that generally discovers new materials through trial and error in the lab. Discovering new materials usually takes several years of research, as well as a considerable amount of resources and investments. Currently, one of the most relevant materials are perovskites, as they hold great promise for the development of solar cells. The crystallization mechanism is the most relevant method to synthesize perovskites as it allows a detailed (compositional and chemical) characterization of the material structure, among the different methods. However, because of the sensitivity of the crystallization process, experimental conditions that produce pervoskite crystals are hardly discovered. Hence,the experimental trial and error process usually results in imbalanced data (where most experiments do not produce crystals). In this context, studies have shown that it is possible to develop classification models that predict perovskite crystallization using data collected in laboratory experiments. However, from a methodological point of view, these models have been developed without considering the characteristics of using experimental data (such as the limited data available, class imbalances, biases in data collection, among others). In this work, we studied model evaluation sensitivity to errors in data collection and experimental data sampling. Therefore, we analyzed how traditional classification metrics behave, using synthetic confusion matrices, when small and imbalance datasets are used. We proposed an alternative evaluation method, based on a bidimensional representation of two complementary metrics, which makes it easier to distinguish model performance. Finally, we applied this method to study ensamble models for small datasets, concluding that the combination of specialized models in different classes produces high-performance models. Keywords: perovskite, crystallization, machine learning, imbalance, ensambleFil: Ticona Oquendo, María Belén. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesOnna, Diego ArielTurjanski, Pablo Guillermo2023info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000543_Ticonaspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-10-16T09:31:07Zseminario:seminario_nCOM000543_TiconaInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-10-16 09:31:08.551Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse |
dc.title.none.fl_str_mv |
Predicción de cristalización de perovskitas mediante aprendizaje automático |
title |
Predicción de cristalización de perovskitas mediante aprendizaje automático |
spellingShingle |
Predicción de cristalización de perovskitas mediante aprendizaje automático Ticona Oquendo, María Belén PEROVSKITA CRISTALIZACION APRENDIZAJE AUTOMATICO DESBALANCE ENSAMBLES PEROVSKITE CRYSTALLIZATION MACHINE LEARNING IMBALANCE ENSAMBLE |
title_short |
Predicción de cristalización de perovskitas mediante aprendizaje automático |
title_full |
Predicción de cristalización de perovskitas mediante aprendizaje automático |
title_fullStr |
Predicción de cristalización de perovskitas mediante aprendizaje automático |
title_full_unstemmed |
Predicción de cristalización de perovskitas mediante aprendizaje automático |
title_sort |
Predicción de cristalización de perovskitas mediante aprendizaje automático |
dc.creator.none.fl_str_mv |
Ticona Oquendo, María Belén |
author |
Ticona Oquendo, María Belén |
author_facet |
Ticona Oquendo, María Belén |
author_role |
author |
dc.contributor.none.fl_str_mv |
Onna, Diego Ariel Turjanski, Pablo Guillermo |
dc.subject.none.fl_str_mv |
PEROVSKITA CRISTALIZACION APRENDIZAJE AUTOMATICO DESBALANCE ENSAMBLES PEROVSKITE CRYSTALLIZATION MACHINE LEARNING IMBALANCE ENSAMBLE |
topic |
PEROVSKITA CRISTALIZACION APRENDIZAJE AUTOMATICO DESBALANCE ENSAMBLES PEROVSKITE CRYSTALLIZATION MACHINE LEARNING IMBALANCE ENSAMBLE |
dc.description.none.fl_txt_mv |
La ciencia de los materiales es un área de estudio interdisciplinar en el que tradicionalmente se descubren materiales mediante la prueba y error experimental en el laboratorio. Descubrir un nuevo material suele llevar varios años de investigación, así como también una considerable cantidad de recursos e inversiones. Actualmente, uno de los materiales más investigados son las perovskitas por ser una promesa en el desarrollo de paneles solares. Si bien existen múltiples maneras de sintetizarlas, se destaca en particular la técnica de cristalización debido a que permite obtener una caracterización detallada de su composición y estructura química, entre otros motivos. Sin embargo, debido a la sensibilidad de este proceso químico, es difícil conocer en qué condiciones experimentales se produce la cristalización. De allí que el uso del tradicional mecanismo de prueba y error experimental suela generar datos en los que mayoritariamente no cristaliza la perovskita. En este contexto, existen trabajos que han demostrado que es posible desarrollar modelos de predicción de cristalización de perovskitas empleando técnicas de aprendizaje automático, usando datos ya recolectados sobre experimentaciones de síntesis de cristales. No obstante, desde un punto de vista metodológico, estos modelos se han realizado sin considerar las características que conlleva usar datos experimentales, como por ejemplo, la cantidad acotada de datos, el desbalance entre experimentaciones en donde efectivamente Material science is an interdisciplinary field that generally discovers new materials through trial and error in the lab. Discovering new materials usually takes several years of research, as well as a considerable amount of resources and investments. Currently, one of the most relevant materials are perovskites, as they hold great promise for the development of solar cells. The crystallization mechanism is the most relevant method to synthesize perovskites as it allows a detailed (compositional and chemical) characterization of the material structure, among the different methods. However, because of the sensitivity of the crystallization process, experimental conditions that produce pervoskite crystals are hardly discovered. Hence,the experimental trial and error process usually results in imbalanced data (where most experiments do not produce crystals). In this context, studies have shown that it is possible to develop classification models that predict perovskite crystallization using data collected in laboratory experiments. However, from a methodological point of view, these models have been developed without considering the characteristics of using experimental data (such as the limited data available, class imbalances, biases in data collection, among others). In this work, we studied model evaluation sensitivity to errors in data collection and experimental data sampling. Therefore, we analyzed how traditional classification metrics behave, using synthetic confusion matrices, when small and imbalance datasets are used. We proposed an alternative evaluation method, based on a bidimensional representation of two complementary metrics, which makes it easier to distinguish model performance. Finally, we applied this method to study ensamble models for small datasets, concluding that the combination of specialized models in different classes produces high-performance models. Keywords: perovskite, crystallization, machine learning, imbalance, ensamble Fil: Ticona Oquendo, María Belén. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. |
description |
La ciencia de los materiales es un área de estudio interdisciplinar en el que tradicionalmente se descubren materiales mediante la prueba y error experimental en el laboratorio. Descubrir un nuevo material suele llevar varios años de investigación, así como también una considerable cantidad de recursos e inversiones. Actualmente, uno de los materiales más investigados son las perovskitas por ser una promesa en el desarrollo de paneles solares. Si bien existen múltiples maneras de sintetizarlas, se destaca en particular la técnica de cristalización debido a que permite obtener una caracterización detallada de su composición y estructura química, entre otros motivos. Sin embargo, debido a la sensibilidad de este proceso químico, es difícil conocer en qué condiciones experimentales se produce la cristalización. De allí que el uso del tradicional mecanismo de prueba y error experimental suela generar datos en los que mayoritariamente no cristaliza la perovskita. En este contexto, existen trabajos que han demostrado que es posible desarrollar modelos de predicción de cristalización de perovskitas empleando técnicas de aprendizaje automático, usando datos ya recolectados sobre experimentaciones de síntesis de cristales. No obstante, desde un punto de vista metodológico, estos modelos se han realizado sin considerar las características que conlleva usar datos experimentales, como por ejemplo, la cantidad acotada de datos, el desbalance entre experimentaciones en donde efectivamente |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
https://hdl.handle.net/20.500.12110/seminario_nCOM000543_Ticona |
url |
https://hdl.handle.net/20.500.12110/seminario_nCOM000543_Ticona |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN |
reponame_str |
Biblioteca Digital (UBA-FCEN) |
collection |
Biblioteca Digital (UBA-FCEN) |
instname_str |
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
instacron_str |
UBA-FCEN |
institution |
UBA-FCEN |
repository.name.fl_str_mv |
Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
repository.mail.fl_str_mv |
ana@bl.fcen.uba.ar |
_version_ |
1846142861892911104 |
score |
12.712165 |