Metodología automática para mapeo y seguimiento de la condición de cultivos agrícolas durante la zafra a partir de imágenes satelitales y aprendizaje automático en Uruguay

Autores
Cal Álvarez, Adrián Tabaré
Año de publicación
2022
Idioma
español castellano
Tipo de recurso
tesis de maestría
Estado
versión publicada
Colaborador/a o director/a de tesis
Musé, Pablo
Preciozzi, Javier
Descripción
El presente trabajo tiene como principal objetivo el desarrollo de una metodología para la identificación de cultivos agrícolas de verano en Uruguay, a partir del uso de imágenes satelitales y aprendizaje automático. Para ello, como insumo se utilizaron bases de datos con información georreferenciada de campo, e imágenes satelitales de libre acceso. De las bases, dos fueron proporcionadas por organizaciones de productores agropecuarios y son de chacras con agricultura, y otras del Ministerio de Ganadería, Agricultura y Pesca de Uruguay (MGAP). Una con información de coberturas y usos del suelo, y otra de chacras con planes de uso para conservación del suelo por erosión. Los cultivos agrícolas presentes en las bases son maíz, soja y sorgo. Las imágenes utilizadas provienen de los satélites de tipo óptico, Sentinel 2 y Terra, y de Sentinel 1, que tiene un sensor radar de apertura sintética. De estos satélites, en particular de Sentinel 1 y 2, se obtuvieron series temporales de varias bandas del espectro electromagnético. El procesamiento de los datos se hizo a través del uso combinado de algoritmos de clasificación no supervisada, supervisada y de reducción de la dimensionalidad. De los no supervisados se evaluaron Gaussian Mixture Model (GMM), K-Means, Learning Vector Quantization (LVQ), Self Organizing Map (SOM) de Kohonen y Spectral Clustering. De los supervisados se evaluaron AdaBoost, Gradient Tree Boosting, Random Forest, Support Vector Machine (SVM) y XGBoost. El algoritmo de reducción de la dimensionalidad utilizado fue t-Distributed Stochastic Neighbor Embedding (t-SNE). Una de las herramientas utilizadas para el procesamiento de los datos georreferenciados y las imágenes satelitales es la moderna y potente plataforma de análisis geoespacial en la nube Google Earth Engine (earthengine.google.com). Con el uso de esta herramienta se generaron mapas a nivel nacional clasificados pixel a pixel. Combinando clasificación no supervisada con el algoritmo de t-SNE se desarrolló una técnica para identificar y depurar datos mal etiquetados, así como zonas sin agricultura dentro de las chacras. Para la clasificación supervisada se generaron modelos que en la dimensión espacial trabajan clasificando puntos georreferenciados, o a nivel nacional, pixel a pixel, y a nivel de cultivo estos indican si hay agricultura o no (modelos binarios) y el tipo de cultivo específico (maíz, soja o sorgo). De los algoritmos supervisados, Random Forest y XGBoost fueron los de mejor desempeño. Para los modelos de clasificación binaria, el mejor desempeño fue 98,5 de F1-Score. Para los modelos de cultivo a nivel de chacra, en maíz y sorgo, el mejor desempeño fue 75,3 y 77,5 de F1, y en soja 98,5, siendo este último superior al obtenido en varios trabajos internacionales. Otro de los objetivos específicos de este trabajo fue poder realizar el seguimiento de la condición de los cultivos en la chacra durante la zafra. Para ello se desarrolló una metodología que utilizando K-Means realiza la zonificación de la chacra en dos o más zonas de acuerdo con la evolución temporal del índice NDVI desde la siembra. Además, a partir de la firma fenológica mediana de la chacra, suavizada a paso diario, y con análisis de derivada primera, se extrajeron las métricas fenológicas de mínimo, punto de inflexión, máximo, días desde mínimo a máximo, amplitud de NDVI entre mínimo y máximo, entre otras. A partir de estás métricas se puede caracterizar una chacra y hacer comparaciones con otras.
This work primarily aims to develop a methodology for identifying summer crops in Uruguay, utilizing satellite images and machine learning. For this, databases with georeferenced field information and freely accessible satellite images were used as input. Agricultural producer organizations provided two of the databases, related to farms with agriculture, and others came from the Ministry of Livestock, Agriculture, and Fisheries of Uruguay (MGAP). One database contained information on land cover and land uses and another offered plans for soil conservation due to erosion. The crops present in the databases are corn, soybeans, and sorghum. The images used derive from optical-type satellites Sentinel 2 and Terra and from Sentinel 1, which has a synthetic aperture radar sensor. From these satellites, particularly from Sentinel 1 and 2, time series were obtained from various electromagnetic spectrum bands. Data processing was done through the combined use of unsupervised, supervised, and dimensionality reduction classification algorithms. Among the unsupervised ones, Gaussian Mixture Model (GMM), K-Means, Learning Vector Quantization (LVQ), Kohonen's Self Organizing Map (SOM), and Spectral Clustering were evaluated. Among the supervised ones, AdaBoost, Gradient Tree Boosting, Random Forest, Support Vector Machine (SVM), and XGBoost were assessed. The dimensionality reduction algorithm used was t-Distributed Stochastic Neighbor Embedding (t-SNE). Using the modern and powerful cloud-based geospatial analysis platform Google Earth Engine (earthengine.google.com), maps were generated at the national level, classified pixel by pixel. Combining unsupervised classification with the t-SNE algorithm, a technique was developed to identify and clean mislabeled data and areas without agriculture within the farms. For supervised classification, models were generated that work classifying georeferenced points in the spatial dimension, or nationally, pixel by pixel, and at the crop level, these indicate whether there is agriculture or not (binary models) and the specific type of crop (corn, soybeans, or sorghum). Regarding the supervised algorithms, Random Forest and XGBoost had the best performance. For the binary classification models, the best performance was 98.5 F1-Score. For the crop models at the farm level, in corn and sorghum, the best performance was 75.3 and 77.5 F1, and in soybeans, 98.5, the latter being higher than that obtained in various international works. Another specific objective of this work was to monitor the condition of the crops on the farm during the season. For this, a methodology was developed that, using K-Means, segmented the farm into two or more areas according to the temporal evolution of the NDVI index from sowing. Also, based on the median phenological signature of the farm, smoothed on a daily step, and with first derivative analysis, phenological metrics of minimum, inflection point, maximum, days from minimum to maximum, NDVI amplitude between minimum and maximum, among others, were extracted. From these metrics, one can characterize a farm and make comparisons with others.
Fil: Cal Álvarez, Adrián Tabaré. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
AGRICULTURA
APRENDIZAJE AUTOMATICO
CLASIFICACION SUPERVISADA Y NO SUPERVISADA
GOOGLE EARTH ENGINE
IMAGENES SATELITALES
METRICAS FENOLOGICAS
SENTINEL
t-SNE
XGBoost
AGRICULTURE
MACHINE LEARNING
SUPERVISED AND UNSUPERVISED CLASSIFICATION
GOOGLE EARTH ENGINE
SATELLITE IMAGES
PHENOLOGICAL METRICS
SENTINEL
t-SNE
XGBoost
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
tesis:tesis_n7436_CalAlvarez

id BDUBAFCEN_99b768d9e3e4e3f18cebd95313dcac59
oai_identifier_str tesis:tesis_n7436_CalAlvarez
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Metodología automática para mapeo y seguimiento de la condición de cultivos agrícolas durante la zafra a partir de imágenes satelitales y aprendizaje automático en UruguayAutomatic methodology for mapping and monitoring the condition of agricultural crops during the season using satellite imagery and machine learning in UruguayCal Álvarez, Adrián TabaréAGRICULTURAAPRENDIZAJE AUTOMATICOCLASIFICACION SUPERVISADA Y NO SUPERVISADAGOOGLE EARTH ENGINEIMAGENES SATELITALESMETRICAS FENOLOGICASSENTINELt-SNEXGBoostAGRICULTUREMACHINE LEARNINGSUPERVISED AND UNSUPERVISED CLASSIFICATIONGOOGLE EARTH ENGINESATELLITE IMAGESPHENOLOGICAL METRICSSENTINELt-SNEXGBoostEl presente trabajo tiene como principal objetivo el desarrollo de una metodología para la identificación de cultivos agrícolas de verano en Uruguay, a partir del uso de imágenes satelitales y aprendizaje automático. Para ello, como insumo se utilizaron bases de datos con información georreferenciada de campo, e imágenes satelitales de libre acceso. De las bases, dos fueron proporcionadas por organizaciones de productores agropecuarios y son de chacras con agricultura, y otras del Ministerio de Ganadería, Agricultura y Pesca de Uruguay (MGAP). Una con información de coberturas y usos del suelo, y otra de chacras con planes de uso para conservación del suelo por erosión. Los cultivos agrícolas presentes en las bases son maíz, soja y sorgo. Las imágenes utilizadas provienen de los satélites de tipo óptico, Sentinel 2 y Terra, y de Sentinel 1, que tiene un sensor radar de apertura sintética. De estos satélites, en particular de Sentinel 1 y 2, se obtuvieron series temporales de varias bandas del espectro electromagnético. El procesamiento de los datos se hizo a través del uso combinado de algoritmos de clasificación no supervisada, supervisada y de reducción de la dimensionalidad. De los no supervisados se evaluaron Gaussian Mixture Model (GMM), K-Means, Learning Vector Quantization (LVQ), Self Organizing Map (SOM) de Kohonen y Spectral Clustering. De los supervisados se evaluaron AdaBoost, Gradient Tree Boosting, Random Forest, Support Vector Machine (SVM) y XGBoost. El algoritmo de reducción de la dimensionalidad utilizado fue t-Distributed Stochastic Neighbor Embedding (t-SNE). Una de las herramientas utilizadas para el procesamiento de los datos georreferenciados y las imágenes satelitales es la moderna y potente plataforma de análisis geoespacial en la nube Google Earth Engine (earthengine.google.com). Con el uso de esta herramienta se generaron mapas a nivel nacional clasificados pixel a pixel. Combinando clasificación no supervisada con el algoritmo de t-SNE se desarrolló una técnica para identificar y depurar datos mal etiquetados, así como zonas sin agricultura dentro de las chacras. Para la clasificación supervisada se generaron modelos que en la dimensión espacial trabajan clasificando puntos georreferenciados, o a nivel nacional, pixel a pixel, y a nivel de cultivo estos indican si hay agricultura o no (modelos binarios) y el tipo de cultivo específico (maíz, soja o sorgo). De los algoritmos supervisados, Random Forest y XGBoost fueron los de mejor desempeño. Para los modelos de clasificación binaria, el mejor desempeño fue 98,5 de F1-Score. Para los modelos de cultivo a nivel de chacra, en maíz y sorgo, el mejor desempeño fue 75,3 y 77,5 de F1, y en soja 98,5, siendo este último superior al obtenido en varios trabajos internacionales. Otro de los objetivos específicos de este trabajo fue poder realizar el seguimiento de la condición de los cultivos en la chacra durante la zafra. Para ello se desarrolló una metodología que utilizando K-Means realiza la zonificación de la chacra en dos o más zonas de acuerdo con la evolución temporal del índice NDVI desde la siembra. Además, a partir de la firma fenológica mediana de la chacra, suavizada a paso diario, y con análisis de derivada primera, se extrajeron las métricas fenológicas de mínimo, punto de inflexión, máximo, días desde mínimo a máximo, amplitud de NDVI entre mínimo y máximo, entre otras. A partir de estás métricas se puede caracterizar una chacra y hacer comparaciones con otras.This work primarily aims to develop a methodology for identifying summer crops in Uruguay, utilizing satellite images and machine learning. For this, databases with georeferenced field information and freely accessible satellite images were used as input. Agricultural producer organizations provided two of the databases, related to farms with agriculture, and others came from the Ministry of Livestock, Agriculture, and Fisheries of Uruguay (MGAP). One database contained information on land cover and land uses and another offered plans for soil conservation due to erosion. The crops present in the databases are corn, soybeans, and sorghum. The images used derive from optical-type satellites Sentinel 2 and Terra and from Sentinel 1, which has a synthetic aperture radar sensor. From these satellites, particularly from Sentinel 1 and 2, time series were obtained from various electromagnetic spectrum bands. Data processing was done through the combined use of unsupervised, supervised, and dimensionality reduction classification algorithms. Among the unsupervised ones, Gaussian Mixture Model (GMM), K-Means, Learning Vector Quantization (LVQ), Kohonen's Self Organizing Map (SOM), and Spectral Clustering were evaluated. Among the supervised ones, AdaBoost, Gradient Tree Boosting, Random Forest, Support Vector Machine (SVM), and XGBoost were assessed. The dimensionality reduction algorithm used was t-Distributed Stochastic Neighbor Embedding (t-SNE). Using the modern and powerful cloud-based geospatial analysis platform Google Earth Engine (earthengine.google.com), maps were generated at the national level, classified pixel by pixel. Combining unsupervised classification with the t-SNE algorithm, a technique was developed to identify and clean mislabeled data and areas without agriculture within the farms. For supervised classification, models were generated that work classifying georeferenced points in the spatial dimension, or nationally, pixel by pixel, and at the crop level, these indicate whether there is agriculture or not (binary models) and the specific type of crop (corn, soybeans, or sorghum). Regarding the supervised algorithms, Random Forest and XGBoost had the best performance. For the binary classification models, the best performance was 98.5 F1-Score. For the crop models at the farm level, in corn and sorghum, the best performance was 75.3 and 77.5 F1, and in soybeans, 98.5, the latter being higher than that obtained in various international works. Another specific objective of this work was to monitor the condition of the crops on the farm during the season. For this, a methodology was developed that, using K-Means, segmented the farm into two or more areas according to the temporal evolution of the NDVI index from sowing. Also, based on the median phenological signature of the farm, smoothed on a daily step, and with first derivative analysis, phenological metrics of minimum, inflection point, maximum, days from minimum to maximum, NDVI amplitude between minimum and maximum, among others, were extracted. From these metrics, one can characterize a farm and make comparisons with others.Fil: Cal Álvarez, Adrián Tabaré. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesMusé, PabloPreciozzi, Javier2022-11-28info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_bdccinfo:ar-repo/semantics/tesisDeMaestriaapplication/pdfhttps://hdl.handle.net/20.500.12110/tesis_n7436_CalAlvarezspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:41:35Ztesis:tesis_n7436_CalAlvarezInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:41:36.424Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Metodología automática para mapeo y seguimiento de la condición de cultivos agrícolas durante la zafra a partir de imágenes satelitales y aprendizaje automático en Uruguay
Automatic methodology for mapping and monitoring the condition of agricultural crops during the season using satellite imagery and machine learning in Uruguay
title Metodología automática para mapeo y seguimiento de la condición de cultivos agrícolas durante la zafra a partir de imágenes satelitales y aprendizaje automático en Uruguay
spellingShingle Metodología automática para mapeo y seguimiento de la condición de cultivos agrícolas durante la zafra a partir de imágenes satelitales y aprendizaje automático en Uruguay
Cal Álvarez, Adrián Tabaré
AGRICULTURA
APRENDIZAJE AUTOMATICO
CLASIFICACION SUPERVISADA Y NO SUPERVISADA
GOOGLE EARTH ENGINE
IMAGENES SATELITALES
METRICAS FENOLOGICAS
SENTINEL
t-SNE
XGBoost
AGRICULTURE
MACHINE LEARNING
SUPERVISED AND UNSUPERVISED CLASSIFICATION
GOOGLE EARTH ENGINE
SATELLITE IMAGES
PHENOLOGICAL METRICS
SENTINEL
t-SNE
XGBoost
title_short Metodología automática para mapeo y seguimiento de la condición de cultivos agrícolas durante la zafra a partir de imágenes satelitales y aprendizaje automático en Uruguay
title_full Metodología automática para mapeo y seguimiento de la condición de cultivos agrícolas durante la zafra a partir de imágenes satelitales y aprendizaje automático en Uruguay
title_fullStr Metodología automática para mapeo y seguimiento de la condición de cultivos agrícolas durante la zafra a partir de imágenes satelitales y aprendizaje automático en Uruguay
title_full_unstemmed Metodología automática para mapeo y seguimiento de la condición de cultivos agrícolas durante la zafra a partir de imágenes satelitales y aprendizaje automático en Uruguay
title_sort Metodología automática para mapeo y seguimiento de la condición de cultivos agrícolas durante la zafra a partir de imágenes satelitales y aprendizaje automático en Uruguay
dc.creator.none.fl_str_mv Cal Álvarez, Adrián Tabaré
author Cal Álvarez, Adrián Tabaré
author_facet Cal Álvarez, Adrián Tabaré
author_role author
dc.contributor.none.fl_str_mv Musé, Pablo
Preciozzi, Javier
dc.subject.none.fl_str_mv AGRICULTURA
APRENDIZAJE AUTOMATICO
CLASIFICACION SUPERVISADA Y NO SUPERVISADA
GOOGLE EARTH ENGINE
IMAGENES SATELITALES
METRICAS FENOLOGICAS
SENTINEL
t-SNE
XGBoost
AGRICULTURE
MACHINE LEARNING
SUPERVISED AND UNSUPERVISED CLASSIFICATION
GOOGLE EARTH ENGINE
SATELLITE IMAGES
PHENOLOGICAL METRICS
SENTINEL
t-SNE
XGBoost
topic AGRICULTURA
APRENDIZAJE AUTOMATICO
CLASIFICACION SUPERVISADA Y NO SUPERVISADA
GOOGLE EARTH ENGINE
IMAGENES SATELITALES
METRICAS FENOLOGICAS
SENTINEL
t-SNE
XGBoost
AGRICULTURE
MACHINE LEARNING
SUPERVISED AND UNSUPERVISED CLASSIFICATION
GOOGLE EARTH ENGINE
SATELLITE IMAGES
PHENOLOGICAL METRICS
SENTINEL
t-SNE
XGBoost
dc.description.none.fl_txt_mv El presente trabajo tiene como principal objetivo el desarrollo de una metodología para la identificación de cultivos agrícolas de verano en Uruguay, a partir del uso de imágenes satelitales y aprendizaje automático. Para ello, como insumo se utilizaron bases de datos con información georreferenciada de campo, e imágenes satelitales de libre acceso. De las bases, dos fueron proporcionadas por organizaciones de productores agropecuarios y son de chacras con agricultura, y otras del Ministerio de Ganadería, Agricultura y Pesca de Uruguay (MGAP). Una con información de coberturas y usos del suelo, y otra de chacras con planes de uso para conservación del suelo por erosión. Los cultivos agrícolas presentes en las bases son maíz, soja y sorgo. Las imágenes utilizadas provienen de los satélites de tipo óptico, Sentinel 2 y Terra, y de Sentinel 1, que tiene un sensor radar de apertura sintética. De estos satélites, en particular de Sentinel 1 y 2, se obtuvieron series temporales de varias bandas del espectro electromagnético. El procesamiento de los datos se hizo a través del uso combinado de algoritmos de clasificación no supervisada, supervisada y de reducción de la dimensionalidad. De los no supervisados se evaluaron Gaussian Mixture Model (GMM), K-Means, Learning Vector Quantization (LVQ), Self Organizing Map (SOM) de Kohonen y Spectral Clustering. De los supervisados se evaluaron AdaBoost, Gradient Tree Boosting, Random Forest, Support Vector Machine (SVM) y XGBoost. El algoritmo de reducción de la dimensionalidad utilizado fue t-Distributed Stochastic Neighbor Embedding (t-SNE). Una de las herramientas utilizadas para el procesamiento de los datos georreferenciados y las imágenes satelitales es la moderna y potente plataforma de análisis geoespacial en la nube Google Earth Engine (earthengine.google.com). Con el uso de esta herramienta se generaron mapas a nivel nacional clasificados pixel a pixel. Combinando clasificación no supervisada con el algoritmo de t-SNE se desarrolló una técnica para identificar y depurar datos mal etiquetados, así como zonas sin agricultura dentro de las chacras. Para la clasificación supervisada se generaron modelos que en la dimensión espacial trabajan clasificando puntos georreferenciados, o a nivel nacional, pixel a pixel, y a nivel de cultivo estos indican si hay agricultura o no (modelos binarios) y el tipo de cultivo específico (maíz, soja o sorgo). De los algoritmos supervisados, Random Forest y XGBoost fueron los de mejor desempeño. Para los modelos de clasificación binaria, el mejor desempeño fue 98,5 de F1-Score. Para los modelos de cultivo a nivel de chacra, en maíz y sorgo, el mejor desempeño fue 75,3 y 77,5 de F1, y en soja 98,5, siendo este último superior al obtenido en varios trabajos internacionales. Otro de los objetivos específicos de este trabajo fue poder realizar el seguimiento de la condición de los cultivos en la chacra durante la zafra. Para ello se desarrolló una metodología que utilizando K-Means realiza la zonificación de la chacra en dos o más zonas de acuerdo con la evolución temporal del índice NDVI desde la siembra. Además, a partir de la firma fenológica mediana de la chacra, suavizada a paso diario, y con análisis de derivada primera, se extrajeron las métricas fenológicas de mínimo, punto de inflexión, máximo, días desde mínimo a máximo, amplitud de NDVI entre mínimo y máximo, entre otras. A partir de estás métricas se puede caracterizar una chacra y hacer comparaciones con otras.
This work primarily aims to develop a methodology for identifying summer crops in Uruguay, utilizing satellite images and machine learning. For this, databases with georeferenced field information and freely accessible satellite images were used as input. Agricultural producer organizations provided two of the databases, related to farms with agriculture, and others came from the Ministry of Livestock, Agriculture, and Fisheries of Uruguay (MGAP). One database contained information on land cover and land uses and another offered plans for soil conservation due to erosion. The crops present in the databases are corn, soybeans, and sorghum. The images used derive from optical-type satellites Sentinel 2 and Terra and from Sentinel 1, which has a synthetic aperture radar sensor. From these satellites, particularly from Sentinel 1 and 2, time series were obtained from various electromagnetic spectrum bands. Data processing was done through the combined use of unsupervised, supervised, and dimensionality reduction classification algorithms. Among the unsupervised ones, Gaussian Mixture Model (GMM), K-Means, Learning Vector Quantization (LVQ), Kohonen's Self Organizing Map (SOM), and Spectral Clustering were evaluated. Among the supervised ones, AdaBoost, Gradient Tree Boosting, Random Forest, Support Vector Machine (SVM), and XGBoost were assessed. The dimensionality reduction algorithm used was t-Distributed Stochastic Neighbor Embedding (t-SNE). Using the modern and powerful cloud-based geospatial analysis platform Google Earth Engine (earthengine.google.com), maps were generated at the national level, classified pixel by pixel. Combining unsupervised classification with the t-SNE algorithm, a technique was developed to identify and clean mislabeled data and areas without agriculture within the farms. For supervised classification, models were generated that work classifying georeferenced points in the spatial dimension, or nationally, pixel by pixel, and at the crop level, these indicate whether there is agriculture or not (binary models) and the specific type of crop (corn, soybeans, or sorghum). Regarding the supervised algorithms, Random Forest and XGBoost had the best performance. For the binary classification models, the best performance was 98.5 F1-Score. For the crop models at the farm level, in corn and sorghum, the best performance was 75.3 and 77.5 F1, and in soybeans, 98.5, the latter being higher than that obtained in various international works. Another specific objective of this work was to monitor the condition of the crops on the farm during the season. For this, a methodology was developed that, using K-Means, segmented the farm into two or more areas according to the temporal evolution of the NDVI index from sowing. Also, based on the median phenological signature of the farm, smoothed on a daily step, and with first derivative analysis, phenological metrics of minimum, inflection point, maximum, days from minimum to maximum, NDVI amplitude between minimum and maximum, among others, were extracted. From these metrics, one can characterize a farm and make comparisons with others.
Fil: Cal Álvarez, Adrián Tabaré. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description El presente trabajo tiene como principal objetivo el desarrollo de una metodología para la identificación de cultivos agrícolas de verano en Uruguay, a partir del uso de imágenes satelitales y aprendizaje automático. Para ello, como insumo se utilizaron bases de datos con información georreferenciada de campo, e imágenes satelitales de libre acceso. De las bases, dos fueron proporcionadas por organizaciones de productores agropecuarios y son de chacras con agricultura, y otras del Ministerio de Ganadería, Agricultura y Pesca de Uruguay (MGAP). Una con información de coberturas y usos del suelo, y otra de chacras con planes de uso para conservación del suelo por erosión. Los cultivos agrícolas presentes en las bases son maíz, soja y sorgo. Las imágenes utilizadas provienen de los satélites de tipo óptico, Sentinel 2 y Terra, y de Sentinel 1, que tiene un sensor radar de apertura sintética. De estos satélites, en particular de Sentinel 1 y 2, se obtuvieron series temporales de varias bandas del espectro electromagnético. El procesamiento de los datos se hizo a través del uso combinado de algoritmos de clasificación no supervisada, supervisada y de reducción de la dimensionalidad. De los no supervisados se evaluaron Gaussian Mixture Model (GMM), K-Means, Learning Vector Quantization (LVQ), Self Organizing Map (SOM) de Kohonen y Spectral Clustering. De los supervisados se evaluaron AdaBoost, Gradient Tree Boosting, Random Forest, Support Vector Machine (SVM) y XGBoost. El algoritmo de reducción de la dimensionalidad utilizado fue t-Distributed Stochastic Neighbor Embedding (t-SNE). Una de las herramientas utilizadas para el procesamiento de los datos georreferenciados y las imágenes satelitales es la moderna y potente plataforma de análisis geoespacial en la nube Google Earth Engine (earthengine.google.com). Con el uso de esta herramienta se generaron mapas a nivel nacional clasificados pixel a pixel. Combinando clasificación no supervisada con el algoritmo de t-SNE se desarrolló una técnica para identificar y depurar datos mal etiquetados, así como zonas sin agricultura dentro de las chacras. Para la clasificación supervisada se generaron modelos que en la dimensión espacial trabajan clasificando puntos georreferenciados, o a nivel nacional, pixel a pixel, y a nivel de cultivo estos indican si hay agricultura o no (modelos binarios) y el tipo de cultivo específico (maíz, soja o sorgo). De los algoritmos supervisados, Random Forest y XGBoost fueron los de mejor desempeño. Para los modelos de clasificación binaria, el mejor desempeño fue 98,5 de F1-Score. Para los modelos de cultivo a nivel de chacra, en maíz y sorgo, el mejor desempeño fue 75,3 y 77,5 de F1, y en soja 98,5, siendo este último superior al obtenido en varios trabajos internacionales. Otro de los objetivos específicos de este trabajo fue poder realizar el seguimiento de la condición de los cultivos en la chacra durante la zafra. Para ello se desarrolló una metodología que utilizando K-Means realiza la zonificación de la chacra en dos o más zonas de acuerdo con la evolución temporal del índice NDVI desde la siembra. Además, a partir de la firma fenológica mediana de la chacra, suavizada a paso diario, y con análisis de derivada primera, se extrajeron las métricas fenológicas de mínimo, punto de inflexión, máximo, días desde mínimo a máximo, amplitud de NDVI entre mínimo y máximo, entre otras. A partir de estás métricas se puede caracterizar una chacra y hacer comparaciones con otras.
publishDate 2022
dc.date.none.fl_str_mv 2022-11-28
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_bdcc
info:ar-repo/semantics/tesisDeMaestria
format masterThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/tesis_n7436_CalAlvarez
url https://hdl.handle.net/20.500.12110/tesis_n7436_CalAlvarez
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1844618709074706432
score 13.070432