Estimación de ocurrencia de granizo en superficie y daño en cultivos, mediante datos del radar meteorológico utilizando técnicas de Data Mining

Autores
Bellini Saibene, Yanina Noemi
Año de publicación
2015
Idioma
español castellano
Tipo de recurso
tesis de maestría
Estado
versión publicada
Colaborador/a o director/a de tesis
Volpacchio, Martín
Descripción
Tesis presentada para optar por el grado de Magíster en Explotación de Datos y Gestión del Conocimiento, de la Universidad Austral, en octubre de 2015
El granizo es capaz de infligir cuantiosos daños y el estudio de su frecuencia e impacto económico es de interés para la industria de los seguros y el sector agroindustrial. Con el objetivo de estimar la ocurrencia de granizo en superficie y el posible daño ocasionado a los cultivos se utilizó Gene Expression Programming (GEP) Regresión Logística usando datos del radar polarimétrico de banda C INTA Anguil, La Pampa) desde Marzo de 2009 a Marzo de 2013. La complejidad en la captura de los datos implicó el desarrollo de un software específico para procesar los datos del radar, gestionar la información de reportes de ocurrencia y daño por granizo y unificar ambos tipos de datos. La ocurrencia de granizo en superficie se modeló como un problema binario, utilizando solo variables derivadas del radar. A pesar de la simplicidad del modelo obtenido, una comparación entre medidas de performance (Probabilidad de Detección (POD), Falsas Alarmas (FAR) y Porcentaje Correcto (PC)) entre 30 modelos internacionales publicados, que usan diferentes técnicas y set de datos, ubicó a nuestro modelo entre los tres primeros. Confirmando que los modelos con variables polarimétricas funcionan mejor que aquellos que usan variables de simple polarización y que la presencia de granizo aumenta con mayores valores de Reflectividad (Z), menores valores del Coeficiente de correlación co-polar (RhoHV) y valores extremos de Reflectividad Diferencial (ZDR). La implementación del modelo estableció problemas con el uso de técnicas tradicionales de manejo de datos, alentando enfoques adicionales como bases de datos no estructuradas y técnicas de procesamiento paralelos para la operación de los mismos. Para determinar el daño se usaron variables de radar y de cultivo para clasificarlo en cuatro problemas binarios de acuerdo a los porcentajes de destrucción: leve (1-25%)/no leve, moderado (25-50%)/no moderado, severo (50-75%)/no severo y grave (75-100%)/no grave. Los modelos obtenidos no son robustos en diferenciar estas clases debido a: la simplificación del problema, la baja disponibilidad de datos y la subespecificación de las variables de alto impacto. A pesar de esto, la correlación encontrada, sugiere que estas herramientas se pueden usar para análisis futuros en un conjunto de datos más grande y completo. Análisis adicionales reduciendo los niveles a tres: sin daño, < 50% y >50% aumentan la correlación, reforzando la idea que estas herramientas son adecuadas para generar modelos sobre el daño en cultivos.
Hail is capable of inflicting considerable damage and the study of their frequency and financial impact is useful for the insurance industry and agribusiness. In order to calculate the probability of hail on the ground and possible crops damage Gene Expression Programming (GEP) Logistic Regression was used with data from polarimetric C-band radar (INTA Anguil La Pampa) from March 2009 to March 2013. The complexity of data capture involved the development of a specific software to process radar data, manage information from occurrence reports and hail damage and unify both types of data. The hailfall was modeled as a binary problem, using only variables derived from radar. Despite the simplicity of the model obtained, a comparison between the measurements of performance Probability of Detection (POD), False Alarm Ratio (FAR) and Percent Correct (PC) among 30 reported international models, using different techniques and data sets, showed our analysis within the three models with higher fitting. Confirming that models with polarimetric variables showed higher performance than those with single polarization and the presence of hail increase with higher of Reflectivity (Z) values, lower Correlation Coefficient (RhoHV) values and extreme values of Differential Reflectivity (ZDR). The implementation of the model using traditional data management techniques established problems, encouraging additional approaches like unstructured databases and parallel processing techniques for radar data processing and model operation. The radar and crop variables were used to classify into four binary problems according the percentages of destruction: slight (1- 25%)/no slight, moderate (25-50%)/no moderate, severe (50-75%)/no severe and grave (75-100%)/no grave. Although the models fail to differentiate these four classes due to the simplification of the problem, the lower data availability and a under specification of the high impact variable, a correlation found suggested that these tools can be used for future analysis on larger and more complete dataset. Further analysis reducing the levels to three categories: without damage, <50% and >50% increased the correlation, reinforcing the idea that these tools are useful for generating models that classified crops losses.
EEA Anguil
Fil: Bellini Saibene, Yanina Noemí. Instituto Nacional de Tecnología Agropecuaria (INTA). Estación Experimental Agropecuaria Anguil; Argentina
Materia
Datos
Datos Meteorológicos
Granizo
Daños del Granizo
Data
Data Mining
Weather Data
Hail Damage
Hail
Minería de Datos
Granizo
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
INTA Digital (INTA)
Institución
Instituto Nacional de Tecnología Agropecuaria
OAI Identificador
oai:localhost:20.500.12123/5443

id INTADig_b01a5e66039225b1aa48ede9f83f5736
oai_identifier_str oai:localhost:20.500.12123/5443
network_acronym_str INTADig
repository_id_str l
network_name_str INTA Digital (INTA)
spelling Estimación de ocurrencia de granizo en superficie y daño en cultivos, mediante datos del radar meteorológico utilizando técnicas de Data MiningBellini Saibene, Yanina NoemiDatosDatos MeteorológicosGranizoDaños del GranizoDataData MiningWeather DataHail DamageHailMinería de DatosGranizoTesis presentada para optar por el grado de Magíster en Explotación de Datos y Gestión del Conocimiento, de la Universidad Austral, en octubre de 2015El granizo es capaz de infligir cuantiosos daños y el estudio de su frecuencia e impacto económico es de interés para la industria de los seguros y el sector agroindustrial. Con el objetivo de estimar la ocurrencia de granizo en superficie y el posible daño ocasionado a los cultivos se utilizó Gene Expression Programming (GEP) Regresión Logística usando datos del radar polarimétrico de banda C INTA Anguil, La Pampa) desde Marzo de 2009 a Marzo de 2013. La complejidad en la captura de los datos implicó el desarrollo de un software específico para procesar los datos del radar, gestionar la información de reportes de ocurrencia y daño por granizo y unificar ambos tipos de datos. La ocurrencia de granizo en superficie se modeló como un problema binario, utilizando solo variables derivadas del radar. A pesar de la simplicidad del modelo obtenido, una comparación entre medidas de performance (Probabilidad de Detección (POD), Falsas Alarmas (FAR) y Porcentaje Correcto (PC)) entre 30 modelos internacionales publicados, que usan diferentes técnicas y set de datos, ubicó a nuestro modelo entre los tres primeros. Confirmando que los modelos con variables polarimétricas funcionan mejor que aquellos que usan variables de simple polarización y que la presencia de granizo aumenta con mayores valores de Reflectividad (Z), menores valores del Coeficiente de correlación co-polar (RhoHV) y valores extremos de Reflectividad Diferencial (ZDR). La implementación del modelo estableció problemas con el uso de técnicas tradicionales de manejo de datos, alentando enfoques adicionales como bases de datos no estructuradas y técnicas de procesamiento paralelos para la operación de los mismos. Para determinar el daño se usaron variables de radar y de cultivo para clasificarlo en cuatro problemas binarios de acuerdo a los porcentajes de destrucción: leve (1-25%)/no leve, moderado (25-50%)/no moderado, severo (50-75%)/no severo y grave (75-100%)/no grave. Los modelos obtenidos no son robustos en diferenciar estas clases debido a: la simplificación del problema, la baja disponibilidad de datos y la subespecificación de las variables de alto impacto. A pesar de esto, la correlación encontrada, sugiere que estas herramientas se pueden usar para análisis futuros en un conjunto de datos más grande y completo. Análisis adicionales reduciendo los niveles a tres: sin daño, < 50% y >50% aumentan la correlación, reforzando la idea que estas herramientas son adecuadas para generar modelos sobre el daño en cultivos.Hail is capable of inflicting considerable damage and the study of their frequency and financial impact is useful for the insurance industry and agribusiness. In order to calculate the probability of hail on the ground and possible crops damage Gene Expression Programming (GEP) Logistic Regression was used with data from polarimetric C-band radar (INTA Anguil La Pampa) from March 2009 to March 2013. The complexity of data capture involved the development of a specific software to process radar data, manage information from occurrence reports and hail damage and unify both types of data. The hailfall was modeled as a binary problem, using only variables derived from radar. Despite the simplicity of the model obtained, a comparison between the measurements of performance Probability of Detection (POD), False Alarm Ratio (FAR) and Percent Correct (PC) among 30 reported international models, using different techniques and data sets, showed our analysis within the three models with higher fitting. Confirming that models with polarimetric variables showed higher performance than those with single polarization and the presence of hail increase with higher of Reflectivity (Z) values, lower Correlation Coefficient (RhoHV) values and extreme values of Differential Reflectivity (ZDR). The implementation of the model using traditional data management techniques established problems, encouraging additional approaches like unstructured databases and parallel processing techniques for radar data processing and model operation. The radar and crop variables were used to classify into four binary problems according the percentages of destruction: slight (1- 25%)/no slight, moderate (25-50%)/no moderate, severe (50-75%)/no severe and grave (75-100%)/no grave. Although the models fail to differentiate these four classes due to the simplification of the problem, the lower data availability and a under specification of the high impact variable, a correlation found suggested that these tools can be used for future analysis on larger and more complete dataset. Further analysis reducing the levels to three categories: without damage, <50% and >50% increased the correlation, reinforcing the idea that these tools are useful for generating models that classified crops losses.EEA AnguilFil: Bellini Saibene, Yanina Noemí. Instituto Nacional de Tecnología Agropecuaria (INTA). Estación Experimental Agropecuaria Anguil; ArgentinaUniversidad AustralVolpacchio, Martín2019-07-05T11:08:04Z2019-07-05T11:08:04Z2015-03-03info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_bdccinfo:ar-repo/semantics/tesisDeMaestriaapplication/pdfhttp://hdl.handle.net/20.500.12123/5443spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:INTA Digital (INTA)instname:Instituto Nacional de Tecnología Agropecuaria2025-09-29T13:44:42Zoai:localhost:20.500.12123/5443instacron:INTAInstitucionalhttp://repositorio.inta.gob.ar/Organismo científico-tecnológicoNo correspondehttp://repositorio.inta.gob.ar/oai/requesttripaldi.nicolas@inta.gob.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:l2025-09-29 13:44:42.765INTA Digital (INTA) - Instituto Nacional de Tecnología Agropecuariafalse
dc.title.none.fl_str_mv Estimación de ocurrencia de granizo en superficie y daño en cultivos, mediante datos del radar meteorológico utilizando técnicas de Data Mining
title Estimación de ocurrencia de granizo en superficie y daño en cultivos, mediante datos del radar meteorológico utilizando técnicas de Data Mining
spellingShingle Estimación de ocurrencia de granizo en superficie y daño en cultivos, mediante datos del radar meteorológico utilizando técnicas de Data Mining
Bellini Saibene, Yanina Noemi
Datos
Datos Meteorológicos
Granizo
Daños del Granizo
Data
Data Mining
Weather Data
Hail Damage
Hail
Minería de Datos
Granizo
title_short Estimación de ocurrencia de granizo en superficie y daño en cultivos, mediante datos del radar meteorológico utilizando técnicas de Data Mining
title_full Estimación de ocurrencia de granizo en superficie y daño en cultivos, mediante datos del radar meteorológico utilizando técnicas de Data Mining
title_fullStr Estimación de ocurrencia de granizo en superficie y daño en cultivos, mediante datos del radar meteorológico utilizando técnicas de Data Mining
title_full_unstemmed Estimación de ocurrencia de granizo en superficie y daño en cultivos, mediante datos del radar meteorológico utilizando técnicas de Data Mining
title_sort Estimación de ocurrencia de granizo en superficie y daño en cultivos, mediante datos del radar meteorológico utilizando técnicas de Data Mining
dc.creator.none.fl_str_mv Bellini Saibene, Yanina Noemi
author Bellini Saibene, Yanina Noemi
author_facet Bellini Saibene, Yanina Noemi
author_role author
dc.contributor.none.fl_str_mv Volpacchio, Martín
dc.subject.none.fl_str_mv Datos
Datos Meteorológicos
Granizo
Daños del Granizo
Data
Data Mining
Weather Data
Hail Damage
Hail
Minería de Datos
Granizo
topic Datos
Datos Meteorológicos
Granizo
Daños del Granizo
Data
Data Mining
Weather Data
Hail Damage
Hail
Minería de Datos
Granizo
dc.description.none.fl_txt_mv Tesis presentada para optar por el grado de Magíster en Explotación de Datos y Gestión del Conocimiento, de la Universidad Austral, en octubre de 2015
El granizo es capaz de infligir cuantiosos daños y el estudio de su frecuencia e impacto económico es de interés para la industria de los seguros y el sector agroindustrial. Con el objetivo de estimar la ocurrencia de granizo en superficie y el posible daño ocasionado a los cultivos se utilizó Gene Expression Programming (GEP) Regresión Logística usando datos del radar polarimétrico de banda C INTA Anguil, La Pampa) desde Marzo de 2009 a Marzo de 2013. La complejidad en la captura de los datos implicó el desarrollo de un software específico para procesar los datos del radar, gestionar la información de reportes de ocurrencia y daño por granizo y unificar ambos tipos de datos. La ocurrencia de granizo en superficie se modeló como un problema binario, utilizando solo variables derivadas del radar. A pesar de la simplicidad del modelo obtenido, una comparación entre medidas de performance (Probabilidad de Detección (POD), Falsas Alarmas (FAR) y Porcentaje Correcto (PC)) entre 30 modelos internacionales publicados, que usan diferentes técnicas y set de datos, ubicó a nuestro modelo entre los tres primeros. Confirmando que los modelos con variables polarimétricas funcionan mejor que aquellos que usan variables de simple polarización y que la presencia de granizo aumenta con mayores valores de Reflectividad (Z), menores valores del Coeficiente de correlación co-polar (RhoHV) y valores extremos de Reflectividad Diferencial (ZDR). La implementación del modelo estableció problemas con el uso de técnicas tradicionales de manejo de datos, alentando enfoques adicionales como bases de datos no estructuradas y técnicas de procesamiento paralelos para la operación de los mismos. Para determinar el daño se usaron variables de radar y de cultivo para clasificarlo en cuatro problemas binarios de acuerdo a los porcentajes de destrucción: leve (1-25%)/no leve, moderado (25-50%)/no moderado, severo (50-75%)/no severo y grave (75-100%)/no grave. Los modelos obtenidos no son robustos en diferenciar estas clases debido a: la simplificación del problema, la baja disponibilidad de datos y la subespecificación de las variables de alto impacto. A pesar de esto, la correlación encontrada, sugiere que estas herramientas se pueden usar para análisis futuros en un conjunto de datos más grande y completo. Análisis adicionales reduciendo los niveles a tres: sin daño, < 50% y >50% aumentan la correlación, reforzando la idea que estas herramientas son adecuadas para generar modelos sobre el daño en cultivos.
Hail is capable of inflicting considerable damage and the study of their frequency and financial impact is useful for the insurance industry and agribusiness. In order to calculate the probability of hail on the ground and possible crops damage Gene Expression Programming (GEP) Logistic Regression was used with data from polarimetric C-band radar (INTA Anguil La Pampa) from March 2009 to March 2013. The complexity of data capture involved the development of a specific software to process radar data, manage information from occurrence reports and hail damage and unify both types of data. The hailfall was modeled as a binary problem, using only variables derived from radar. Despite the simplicity of the model obtained, a comparison between the measurements of performance Probability of Detection (POD), False Alarm Ratio (FAR) and Percent Correct (PC) among 30 reported international models, using different techniques and data sets, showed our analysis within the three models with higher fitting. Confirming that models with polarimetric variables showed higher performance than those with single polarization and the presence of hail increase with higher of Reflectivity (Z) values, lower Correlation Coefficient (RhoHV) values and extreme values of Differential Reflectivity (ZDR). The implementation of the model using traditional data management techniques established problems, encouraging additional approaches like unstructured databases and parallel processing techniques for radar data processing and model operation. The radar and crop variables were used to classify into four binary problems according the percentages of destruction: slight (1- 25%)/no slight, moderate (25-50%)/no moderate, severe (50-75%)/no severe and grave (75-100%)/no grave. Although the models fail to differentiate these four classes due to the simplification of the problem, the lower data availability and a under specification of the high impact variable, a correlation found suggested that these tools can be used for future analysis on larger and more complete dataset. Further analysis reducing the levels to three categories: without damage, <50% and >50% increased the correlation, reinforcing the idea that these tools are useful for generating models that classified crops losses.
EEA Anguil
Fil: Bellini Saibene, Yanina Noemí. Instituto Nacional de Tecnología Agropecuaria (INTA). Estación Experimental Agropecuaria Anguil; Argentina
description Tesis presentada para optar por el grado de Magíster en Explotación de Datos y Gestión del Conocimiento, de la Universidad Austral, en octubre de 2015
publishDate 2015
dc.date.none.fl_str_mv 2015-03-03
2019-07-05T11:08:04Z
2019-07-05T11:08:04Z
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_bdcc
info:ar-repo/semantics/tesisDeMaestria
format masterThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/20.500.12123/5443
url http://hdl.handle.net/20.500.12123/5443
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad Austral
publisher.none.fl_str_mv Universidad Austral
dc.source.none.fl_str_mv reponame:INTA Digital (INTA)
instname:Instituto Nacional de Tecnología Agropecuaria
reponame_str INTA Digital (INTA)
collection INTA Digital (INTA)
instname_str Instituto Nacional de Tecnología Agropecuaria
repository.name.fl_str_mv INTA Digital (INTA) - Instituto Nacional de Tecnología Agropecuaria
repository.mail.fl_str_mv tripaldi.nicolas@inta.gob.ar
_version_ 1844619135488622592
score 12.559606