Google Earth Engine: aplicación de algoritmos para clasificar y estimar áreas con cultivos a partir de sensores remotos en tres zonas de la provincia de Córdoba

Autores
Clemente, Juan Pablo
Año de publicación
2023
Idioma
español castellano
Tipo de recurso
tesis de maestría
Estado
versión publicada
Colaborador/a o director/a de tesis
Ovando, Gustavo Gabriel
Descripción
Tesis (Magister en aplicaciones de información espacial)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2023.
Maestría conjunta con el Instituto de Altos Estudios Espaciales "Mario Gulich"-CONAE.
Fil: Clemente, Juan Pablo. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Fil: Clemente, Juan Pablo. Comisión Nacional de Actividades Espaciales. Instituto de Altos Estudios Espaciales Mario Gulich; Argentina.
Recientemente la plataforma Google Earth Engine (GEE) se ha utilizado en una amplia gama de actividades de observación de la Tierra, como la clasificación de suelos agrícolas, que es de suma importancia para los productores, comerciantes, consumidores y Estados. El objetivo principal de este trabajo es aplicar esquemas de clasificación de cultivos con Google Earth Engine a partir de datos de sensores ópticos y SAR en tres áreas de Córdoba. Las áreas se ubican al centro norte (CN), al centro sureste (CSE) y al sureste (SE) provincial. Las clases consideradas fueron soja y maíz (campaña agrícola 2017-2018), y adicionalmente monte en el área CN. Los meses que se tuvieron en cuenta fueron enero, febrero y marzo, ya sea individualmente o en conjunto. Con esta información se entrenó y validó cada uno de los modelos. Se emplearon clasificadores Support Vector Machine (SVM) y Random Forest (RF) con diversas configuraciones de parámetros brindando datos de entrada diversas alternativas: Esquema 1, considera solo datos Sentinel-2 (S2) (mediana de mes individual o trimestral); Esquema 2, emplea datos Sentinel-1 (S1) y/o S2 (mediana de mes individual o trimestral) y Esquema 3, usa series temporales de S2. Se consideraron estadísticos para evaluar desempeño de los clasificadores: precisión global (PG), índice kappa, precisión del productor y del usuario. Los modelos que usaron solamente datos S2, en general, arrojaron muy buenos resultados (PG>88%) cuando emplearon información de los tres meses o de los meses en los cuales los cultivos se encuentran cubriendo totalmente el suelo. En la mayoría de los casos, los modelos que utilizan únicamente imágenes S1 presentaron valores de PG inferiores a los obtenidos cuando se emplean solamente imágenes S2. Al apilar los datos S1 y S2, los resultados de las clasificaciones superan los valores de PG del 90%, 90% y 92% (CN, CSE y SE). En cuanto al Esquema 3, se observó que con la implementación de series temporales de datos ópticos se obtienen altas precisiones de las clasificaciones. Si bien, casi todos los modelos presentan altos valores de PG, se puede observar que, en algunos casos, la implementación de todas las bandas disponibles en los Esquemas 3 mejoran los rendimientos del clasificador. Al confrontar los mejores modelos de cada Esquema, se observó que los modelos que emplearon series temporales de datos S2 fueron superiores, seguidos por los que utilizaron la fusión de datos S1 con S2, relegando a la última posición a los modelos que usaron solo valores de la mediana de los meses estivales de datos S2. Los resultados obtenidos en esta tesis, así como los Esquemas implementados en GEE serán de acceso abierto y estarán disponibles para uso general.
Recently, the Google Earth Engine (GEE) platform has been used in a wide variety of Earth observation activities, such as agricultural soil classification, which is of utmost importance for producers, traders, consumers, and states. The main objective of this work is to apply crop classification schemes using GEE based on optical and SAR sensor data in three study areas of Córdoba. The areas are located in the central north (CN), central southeast (CSE), and southeast (SE) of the province. The considered classes were soybean and corn (agricultural campaign 2017-2018), and additionally, a forest clase was considered in the CN area. The months taken into account were January, February, and March, either individually or collectively. With this information, each of the models was trained and validated.Machine Learning classifiers, such as Support Vector Machine (SVM) and Random Forest (RF), were employed with different parameter configurations, providing several input data alternatives: Scheme 1 considers only Sentinel-2 (S2) data (individual or quarterly month median); Scheme 2 uses Sentinel-1 (S1) and/or S2 data (individual or quarterly month median); and Scheme 3 uses temporal series of S2 data. Statistical measures were considered to evaluate classifier performance: overall accuracy (OA), kappa index, producer s, and user s accuracy. The models that used only S2 data, in general, showed results higher than (OA >88%) when employing information from all three months or in the months when crops completely covered the soil. In most cases, the models using only S1 images showed OA values lower than those obtained when using only S2 images. By stacking S1 and S2 data, the results of the classifications exceed PG values of 90%, 90% and 92% (CN, CSE and SE respectively). As for Schema 3, it was observed that with the implementation of time series of optical data high precisions of classifications are obtained. Although almost all models presented high OA values, it can be observed that, in some cases, the implementation of all available bands in Scheme 3 improved the classifier performance. When comparing the best models of each schema, it was found that models using S2 time series data performed better than those using the fusion of S1 and S2 data, while the models using only the median values of S2 data during summer months ranked last. The information and results obtained in this thesis, as well as the GEE developed Schemes and data will be open access and available for general use. Releasing and sharing these developed Schemes with the community is essential to strengthen collaborative work, and continue to improve the efficiency of present methodologies.
Fil: Clemente, Juan Pablo. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Fil: Clemente, Juan Pablo. Comisión Nacional de Actividades Espaciales. Instituto de Altos Estudios Espaciales Mario Gulich; Argentina.
Materia
Procesamiento de imágenes
Sentinel-1
Sentinel-2
Series de tiempo
Clasificación de cultivos
Image processing
Support vector machine
Random forest
GEE
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Repositorio
Repositorio Digital Universitario (UNC)
Institución
Universidad Nacional de Córdoba
OAI Identificador
oai:rdu.unc.edu.ar:11086/551283

id RDUUNC_1a89037cf732b5c0d9e3f5809b4d7dbe
oai_identifier_str oai:rdu.unc.edu.ar:11086/551283
network_acronym_str RDUUNC
repository_id_str 2572
network_name_str Repositorio Digital Universitario (UNC)
spelling Google Earth Engine: aplicación de algoritmos para clasificar y estimar áreas con cultivos a partir de sensores remotos en tres zonas de la provincia de CórdobaClemente, Juan PabloProcesamiento de imágenesSentinel-1Sentinel-2Series de tiempoClasificación de cultivosImage processingSupport vector machineRandom forestGEETesis (Magister en aplicaciones de información espacial)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2023.Maestría conjunta con el Instituto de Altos Estudios Espaciales "Mario Gulich"-CONAE.Fil: Clemente, Juan Pablo. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.Fil: Clemente, Juan Pablo. Comisión Nacional de Actividades Espaciales. Instituto de Altos Estudios Espaciales Mario Gulich; Argentina.Recientemente la plataforma Google Earth Engine (GEE) se ha utilizado en una amplia gama de actividades de observación de la Tierra, como la clasificación de suelos agrícolas, que es de suma importancia para los productores, comerciantes, consumidores y Estados. El objetivo principal de este trabajo es aplicar esquemas de clasificación de cultivos con Google Earth Engine a partir de datos de sensores ópticos y SAR en tres áreas de Córdoba. Las áreas se ubican al centro norte (CN), al centro sureste (CSE) y al sureste (SE) provincial. Las clases consideradas fueron soja y maíz (campaña agrícola 2017-2018), y adicionalmente monte en el área CN. Los meses que se tuvieron en cuenta fueron enero, febrero y marzo, ya sea individualmente o en conjunto. Con esta información se entrenó y validó cada uno de los modelos. Se emplearon clasificadores Support Vector Machine (SVM) y Random Forest (RF) con diversas configuraciones de parámetros brindando datos de entrada diversas alternativas: Esquema 1, considera solo datos Sentinel-2 (S2) (mediana de mes individual o trimestral); Esquema 2, emplea datos Sentinel-1 (S1) y/o S2 (mediana de mes individual o trimestral) y Esquema 3, usa series temporales de S2. Se consideraron estadísticos para evaluar desempeño de los clasificadores: precisión global (PG), índice kappa, precisión del productor y del usuario. Los modelos que usaron solamente datos S2, en general, arrojaron muy buenos resultados (PG>88%) cuando emplearon información de los tres meses o de los meses en los cuales los cultivos se encuentran cubriendo totalmente el suelo. En la mayoría de los casos, los modelos que utilizan únicamente imágenes S1 presentaron valores de PG inferiores a los obtenidos cuando se emplean solamente imágenes S2. Al apilar los datos S1 y S2, los resultados de las clasificaciones superan los valores de PG del 90%, 90% y 92% (CN, CSE y SE). En cuanto al Esquema 3, se observó que con la implementación de series temporales de datos ópticos se obtienen altas precisiones de las clasificaciones. Si bien, casi todos los modelos presentan altos valores de PG, se puede observar que, en algunos casos, la implementación de todas las bandas disponibles en los Esquemas 3 mejoran los rendimientos del clasificador. Al confrontar los mejores modelos de cada Esquema, se observó que los modelos que emplearon series temporales de datos S2 fueron superiores, seguidos por los que utilizaron la fusión de datos S1 con S2, relegando a la última posición a los modelos que usaron solo valores de la mediana de los meses estivales de datos S2. Los resultados obtenidos en esta tesis, así como los Esquemas implementados en GEE serán de acceso abierto y estarán disponibles para uso general.Recently, the Google Earth Engine (GEE) platform has been used in a wide variety of Earth observation activities, such as agricultural soil classification, which is of utmost importance for producers, traders, consumers, and states. The main objective of this work is to apply crop classification schemes using GEE based on optical and SAR sensor data in three study areas of Córdoba. The areas are located in the central north (CN), central southeast (CSE), and southeast (SE) of the province. The considered classes were soybean and corn (agricultural campaign 2017-2018), and additionally, a forest clase was considered in the CN area. The months taken into account were January, February, and March, either individually or collectively. With this information, each of the models was trained and validated.Machine Learning classifiers, such as Support Vector Machine (SVM) and Random Forest (RF), were employed with different parameter configurations, providing several input data alternatives: Scheme 1 considers only Sentinel-2 (S2) data (individual or quarterly month median); Scheme 2 uses Sentinel-1 (S1) and/or S2 data (individual or quarterly month median); and Scheme 3 uses temporal series of S2 data. Statistical measures were considered to evaluate classifier performance: overall accuracy (OA), kappa index, producer s, and user s accuracy. The models that used only S2 data, in general, showed results higher than (OA >88%) when employing information from all three months or in the months when crops completely covered the soil. In most cases, the models using only S1 images showed OA values lower than those obtained when using only S2 images. By stacking S1 and S2 data, the results of the classifications exceed PG values of 90%, 90% and 92% (CN, CSE and SE respectively). As for Schema 3, it was observed that with the implementation of time series of optical data high precisions of classifications are obtained. Although almost all models presented high OA values, it can be observed that, in some cases, the implementation of all available bands in Scheme 3 improved the classifier performance. When comparing the best models of each schema, it was found that models using S2 time series data performed better than those using the fusion of S1 and S2 data, while the models using only the median values of S2 data during summer months ranked last. The information and results obtained in this thesis, as well as the GEE developed Schemes and data will be open access and available for general use. Releasing and sharing these developed Schemes with the community is essential to strengthen collaborative work, and continue to improve the efficiency of present methodologies.Fil: Clemente, Juan Pablo. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.Fil: Clemente, Juan Pablo. Comisión Nacional de Actividades Espaciales. Instituto de Altos Estudios Espaciales Mario Gulich; Argentina.Ovando, Gustavo Gabriel2023-10-04info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_bdccinfo:ar-repo/semantics/tesisDeMaestriaapplication/pdfapplication/zipapplication/zipapplication/zipapplication/vnd.openxmlformats-officedocument.spreadsheetml.sheetapplication/vnd.openxmlformats-officedocument.spreadsheetml.sheetapplication/vnd.openxmlformats-officedocument.spreadsheetml.sheethttp://hdl.handle.net/11086/551283spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-10-16T09:31:00Zoai:rdu.unc.edu.ar:11086/551283Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-10-16 09:31:00.518Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv Google Earth Engine: aplicación de algoritmos para clasificar y estimar áreas con cultivos a partir de sensores remotos en tres zonas de la provincia de Córdoba
title Google Earth Engine: aplicación de algoritmos para clasificar y estimar áreas con cultivos a partir de sensores remotos en tres zonas de la provincia de Córdoba
spellingShingle Google Earth Engine: aplicación de algoritmos para clasificar y estimar áreas con cultivos a partir de sensores remotos en tres zonas de la provincia de Córdoba
Clemente, Juan Pablo
Procesamiento de imágenes
Sentinel-1
Sentinel-2
Series de tiempo
Clasificación de cultivos
Image processing
Support vector machine
Random forest
GEE
title_short Google Earth Engine: aplicación de algoritmos para clasificar y estimar áreas con cultivos a partir de sensores remotos en tres zonas de la provincia de Córdoba
title_full Google Earth Engine: aplicación de algoritmos para clasificar y estimar áreas con cultivos a partir de sensores remotos en tres zonas de la provincia de Córdoba
title_fullStr Google Earth Engine: aplicación de algoritmos para clasificar y estimar áreas con cultivos a partir de sensores remotos en tres zonas de la provincia de Córdoba
title_full_unstemmed Google Earth Engine: aplicación de algoritmos para clasificar y estimar áreas con cultivos a partir de sensores remotos en tres zonas de la provincia de Córdoba
title_sort Google Earth Engine: aplicación de algoritmos para clasificar y estimar áreas con cultivos a partir de sensores remotos en tres zonas de la provincia de Córdoba
dc.creator.none.fl_str_mv Clemente, Juan Pablo
author Clemente, Juan Pablo
author_facet Clemente, Juan Pablo
author_role author
dc.contributor.none.fl_str_mv Ovando, Gustavo Gabriel
dc.subject.none.fl_str_mv Procesamiento de imágenes
Sentinel-1
Sentinel-2
Series de tiempo
Clasificación de cultivos
Image processing
Support vector machine
Random forest
GEE
topic Procesamiento de imágenes
Sentinel-1
Sentinel-2
Series de tiempo
Clasificación de cultivos
Image processing
Support vector machine
Random forest
GEE
dc.description.none.fl_txt_mv Tesis (Magister en aplicaciones de información espacial)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2023.
Maestría conjunta con el Instituto de Altos Estudios Espaciales "Mario Gulich"-CONAE.
Fil: Clemente, Juan Pablo. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Fil: Clemente, Juan Pablo. Comisión Nacional de Actividades Espaciales. Instituto de Altos Estudios Espaciales Mario Gulich; Argentina.
Recientemente la plataforma Google Earth Engine (GEE) se ha utilizado en una amplia gama de actividades de observación de la Tierra, como la clasificación de suelos agrícolas, que es de suma importancia para los productores, comerciantes, consumidores y Estados. El objetivo principal de este trabajo es aplicar esquemas de clasificación de cultivos con Google Earth Engine a partir de datos de sensores ópticos y SAR en tres áreas de Córdoba. Las áreas se ubican al centro norte (CN), al centro sureste (CSE) y al sureste (SE) provincial. Las clases consideradas fueron soja y maíz (campaña agrícola 2017-2018), y adicionalmente monte en el área CN. Los meses que se tuvieron en cuenta fueron enero, febrero y marzo, ya sea individualmente o en conjunto. Con esta información se entrenó y validó cada uno de los modelos. Se emplearon clasificadores Support Vector Machine (SVM) y Random Forest (RF) con diversas configuraciones de parámetros brindando datos de entrada diversas alternativas: Esquema 1, considera solo datos Sentinel-2 (S2) (mediana de mes individual o trimestral); Esquema 2, emplea datos Sentinel-1 (S1) y/o S2 (mediana de mes individual o trimestral) y Esquema 3, usa series temporales de S2. Se consideraron estadísticos para evaluar desempeño de los clasificadores: precisión global (PG), índice kappa, precisión del productor y del usuario. Los modelos que usaron solamente datos S2, en general, arrojaron muy buenos resultados (PG>88%) cuando emplearon información de los tres meses o de los meses en los cuales los cultivos se encuentran cubriendo totalmente el suelo. En la mayoría de los casos, los modelos que utilizan únicamente imágenes S1 presentaron valores de PG inferiores a los obtenidos cuando se emplean solamente imágenes S2. Al apilar los datos S1 y S2, los resultados de las clasificaciones superan los valores de PG del 90%, 90% y 92% (CN, CSE y SE). En cuanto al Esquema 3, se observó que con la implementación de series temporales de datos ópticos se obtienen altas precisiones de las clasificaciones. Si bien, casi todos los modelos presentan altos valores de PG, se puede observar que, en algunos casos, la implementación de todas las bandas disponibles en los Esquemas 3 mejoran los rendimientos del clasificador. Al confrontar los mejores modelos de cada Esquema, se observó que los modelos que emplearon series temporales de datos S2 fueron superiores, seguidos por los que utilizaron la fusión de datos S1 con S2, relegando a la última posición a los modelos que usaron solo valores de la mediana de los meses estivales de datos S2. Los resultados obtenidos en esta tesis, así como los Esquemas implementados en GEE serán de acceso abierto y estarán disponibles para uso general.
Recently, the Google Earth Engine (GEE) platform has been used in a wide variety of Earth observation activities, such as agricultural soil classification, which is of utmost importance for producers, traders, consumers, and states. The main objective of this work is to apply crop classification schemes using GEE based on optical and SAR sensor data in three study areas of Córdoba. The areas are located in the central north (CN), central southeast (CSE), and southeast (SE) of the province. The considered classes were soybean and corn (agricultural campaign 2017-2018), and additionally, a forest clase was considered in the CN area. The months taken into account were January, February, and March, either individually or collectively. With this information, each of the models was trained and validated.Machine Learning classifiers, such as Support Vector Machine (SVM) and Random Forest (RF), were employed with different parameter configurations, providing several input data alternatives: Scheme 1 considers only Sentinel-2 (S2) data (individual or quarterly month median); Scheme 2 uses Sentinel-1 (S1) and/or S2 data (individual or quarterly month median); and Scheme 3 uses temporal series of S2 data. Statistical measures were considered to evaluate classifier performance: overall accuracy (OA), kappa index, producer s, and user s accuracy. The models that used only S2 data, in general, showed results higher than (OA >88%) when employing information from all three months or in the months when crops completely covered the soil. In most cases, the models using only S1 images showed OA values lower than those obtained when using only S2 images. By stacking S1 and S2 data, the results of the classifications exceed PG values of 90%, 90% and 92% (CN, CSE and SE respectively). As for Schema 3, it was observed that with the implementation of time series of optical data high precisions of classifications are obtained. Although almost all models presented high OA values, it can be observed that, in some cases, the implementation of all available bands in Scheme 3 improved the classifier performance. When comparing the best models of each schema, it was found that models using S2 time series data performed better than those using the fusion of S1 and S2 data, while the models using only the median values of S2 data during summer months ranked last. The information and results obtained in this thesis, as well as the GEE developed Schemes and data will be open access and available for general use. Releasing and sharing these developed Schemes with the community is essential to strengthen collaborative work, and continue to improve the efficiency of present methodologies.
Fil: Clemente, Juan Pablo. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Fil: Clemente, Juan Pablo. Comisión Nacional de Actividades Espaciales. Instituto de Altos Estudios Espaciales Mario Gulich; Argentina.
description Tesis (Magister en aplicaciones de información espacial)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2023.
publishDate 2023
dc.date.none.fl_str_mv 2023-10-04
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_bdcc
info:ar-repo/semantics/tesisDeMaestria
format masterThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11086/551283
url http://hdl.handle.net/11086/551283
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/zip
application/zip
application/zip
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet
dc.source.none.fl_str_mv reponame:Repositorio Digital Universitario (UNC)
instname:Universidad Nacional de Córdoba
instacron:UNC
reponame_str Repositorio Digital Universitario (UNC)
collection Repositorio Digital Universitario (UNC)
instname_str Universidad Nacional de Córdoba
instacron_str UNC
institution UNC
repository.name.fl_str_mv Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv oca.unc@gmail.com
_version_ 1846143389617094656
score 12.712165