Comparación de procedimientos de selección de variables para la modelación de la relación clima-patógenos en cultivos
- Autores
- Suarez, Franco; Bruno, Cecilia; Gimenez, Maria De La Paz; Balzarini, Mónica Graciela
- Año de publicación
- 2023
- Idioma
- español castellano
- Tipo de recurso
- artículo
- Estado
- versión publicada
- Descripción
- Hoy es posible acceder fácilmente a cuantiosos volúmenes de datos climáticos georreferenciados. Éstos pueden ser usados para modelar la relación entre condiciones climáticas y enfermedad, para lo cual es necesario usar múltiples variables meteorológicas, usualmente correlacionadas y redundantes. La selección de variables permite identificar un subconjunto de regresoras relevantes para construir modelos predictivos. Stepwise, Boruta y LASSO son procedimientos de selección de variables de distinta naturaleza por lo que su desempeño relativo ha sido poco explorado. El objetivo de este trabajo fue la comparación de estos métodos aplicados simultáneamente en la construcción de modelos de regresión para predecir riesgo de enfermedad desde datos climáticos. Se utilizaron tres bases de datos georreferenciados con valores de presencia/ausencia de distintos patógenos en cultivos de maíz en Argentina. Para cada escenario se obtuvieron variables climáticas del periodo previo a la siembra hasta la cosecha. Con los tres métodos se generaron modelos predictivos con precisión de clasificación cercana al 70 %. LASSO produjo mejor predicción, seleccionando una cantidad intermedia de variables respecto a Stepwise (menor cantidad) y a Boruta (mayor). Los resultados podrían extenderse a otros patosistemas y contribuir a la construcción de sistemas de alarma basados en variables climáticas
Nowadays it is possible to easily access large volumes of georeferenced climatic data. These data can be used to model the relationship between climatic conditions and disease from multiple meteorological variables, usually correlated and redundant. The selection of variables allows the identification of a subset of relevant regressors to build predictive models. Stepwise, Boruta, and LASSO are variable selection procedures of different nature, so their relative performance has been scarcely explored. The objective of this work was the comparison of these methods simultaneously applied in the construction of regression models to predict disease risk from climatic data. Three georeferenced databases were used with presence/absence values of different pathogens in maize crops in Argentina. For each scenario, climatic variables from the period prior to sowing until harvest were obtained. The three variable selection methods obtained models with accuracy close to 70 %. However, LASSO produced the best predictive model, selecting an intermediate number of variables with respect to Stepwise (lower number) and Boruta (higher number). The results could be extended to other pathosystems and inspire the construction of alarm systems based on climatic variables.
Instituto de Patología Vegetal
Fil: Suarez, Franco. Instituto Nacional de Tecnología Agropecuaria (INTA). Instituto de Patología Vegetal; Argentina
Fil: Suarez, Franco. Consejo Nacional de Investigaciones Científicas y Técnicas. Unidad de Fitopatología y Modelización Agrícola (UFyMA); Argentina
Fil: Bruno, Cecilia. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina
Fil: Bruno, Cecilia. Instituto Nacional de Tecnología Agropecuaria (INTA). Instituto de Patología Vegetal; Argentina
Fil: Bruno, Cecilia. Consejo Nacional de Investigaciones Científicas y Técnicas. Unidad de Fitopatología y Modelización Agrícola (UFyMA); Argentina
Fil: Gimenez, Maria De La Paz. Instituto Nacional de Tecnología Agropecuaria (INTA). Instituto de Patología Vegetal; Argentina
Fil: Gimenez, Maria De La Paz. Consejo Nacional de Investigaciones Científicas y Técnicas. Unidad de Fitopatología y Modelización Agrícola (UFyMA); Argentina
Fil: Balzarini, Mónica Graciela. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina
Fil: Balzarini, Mónica Graciela. Instituto Nacional de Tecnología Agropecuaria (INTA). Instituto de Patología Vegetal; Argentina
Fil: Balzarini, Mónica Graciela. Consejo Nacional de Investigaciones Científicas y Técnicas. Unidad de Fitopatología y Modelización Agrícola (UFyMA); Argentina - Fuente
- AgriScientia 40 (2) : 37-48. (2023)
- Materia
-
Clima
Organismos Patógenos
Regresión de Paso Cauteloso
Análisis de la Regresión
Métodos Estadísticos
Climate
Pathogens
Stepwise Regression
Regression Analysis
Statistical Methods - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
.jpg)
- Institución
- Instituto Nacional de Tecnología Agropecuaria
- OAI Identificador
- oai:localhost:20.500.12123/25683
Ver los metadatos del registro completo
| id |
INTADig_c428481712ca47418c15573f1e503538 |
|---|---|
| oai_identifier_str |
oai:localhost:20.500.12123/25683 |
| network_acronym_str |
INTADig |
| repository_id_str |
l |
| network_name_str |
INTA Digital (INTA) |
| spelling |
Comparación de procedimientos de selección de variables para la modelación de la relación clima-patógenos en cultivosSuarez, FrancoBruno, CeciliaGimenez, Maria De La PazBalzarini, Mónica GracielaClimaOrganismos PatógenosRegresión de Paso CautelosoAnálisis de la RegresiónMétodos EstadísticosClimatePathogensStepwise RegressionRegression AnalysisStatistical MethodsHoy es posible acceder fácilmente a cuantiosos volúmenes de datos climáticos georreferenciados. Éstos pueden ser usados para modelar la relación entre condiciones climáticas y enfermedad, para lo cual es necesario usar múltiples variables meteorológicas, usualmente correlacionadas y redundantes. La selección de variables permite identificar un subconjunto de regresoras relevantes para construir modelos predictivos. Stepwise, Boruta y LASSO son procedimientos de selección de variables de distinta naturaleza por lo que su desempeño relativo ha sido poco explorado. El objetivo de este trabajo fue la comparación de estos métodos aplicados simultáneamente en la construcción de modelos de regresión para predecir riesgo de enfermedad desde datos climáticos. Se utilizaron tres bases de datos georreferenciados con valores de presencia/ausencia de distintos patógenos en cultivos de maíz en Argentina. Para cada escenario se obtuvieron variables climáticas del periodo previo a la siembra hasta la cosecha. Con los tres métodos se generaron modelos predictivos con precisión de clasificación cercana al 70 %. LASSO produjo mejor predicción, seleccionando una cantidad intermedia de variables respecto a Stepwise (menor cantidad) y a Boruta (mayor). Los resultados podrían extenderse a otros patosistemas y contribuir a la construcción de sistemas de alarma basados en variables climáticasNowadays it is possible to easily access large volumes of georeferenced climatic data. These data can be used to model the relationship between climatic conditions and disease from multiple meteorological variables, usually correlated and redundant. The selection of variables allows the identification of a subset of relevant regressors to build predictive models. Stepwise, Boruta, and LASSO are variable selection procedures of different nature, so their relative performance has been scarcely explored. The objective of this work was the comparison of these methods simultaneously applied in the construction of regression models to predict disease risk from climatic data. Three georeferenced databases were used with presence/absence values of different pathogens in maize crops in Argentina. For each scenario, climatic variables from the period prior to sowing until harvest were obtained. The three variable selection methods obtained models with accuracy close to 70 %. However, LASSO produced the best predictive model, selecting an intermediate number of variables with respect to Stepwise (lower number) and Boruta (higher number). The results could be extended to other pathosystems and inspire the construction of alarm systems based on climatic variables.Instituto de Patología VegetalFil: Suarez, Franco. Instituto Nacional de Tecnología Agropecuaria (INTA). Instituto de Patología Vegetal; ArgentinaFil: Suarez, Franco. Consejo Nacional de Investigaciones Científicas y Técnicas. Unidad de Fitopatología y Modelización Agrícola (UFyMA); ArgentinaFil: Bruno, Cecilia. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; ArgentinaFil: Bruno, Cecilia. Instituto Nacional de Tecnología Agropecuaria (INTA). Instituto de Patología Vegetal; ArgentinaFil: Bruno, Cecilia. Consejo Nacional de Investigaciones Científicas y Técnicas. Unidad de Fitopatología y Modelización Agrícola (UFyMA); ArgentinaFil: Gimenez, Maria De La Paz. Instituto Nacional de Tecnología Agropecuaria (INTA). Instituto de Patología Vegetal; ArgentinaFil: Gimenez, Maria De La Paz. Consejo Nacional de Investigaciones Científicas y Técnicas. Unidad de Fitopatología y Modelización Agrícola (UFyMA); ArgentinaFil: Balzarini, Mónica Graciela. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; ArgentinaFil: Balzarini, Mónica Graciela. Instituto Nacional de Tecnología Agropecuaria (INTA). Instituto de Patología Vegetal; ArgentinaFil: Balzarini, Mónica Graciela. Consejo Nacional de Investigaciones Científicas y Técnicas. Unidad de Fitopatología y Modelización Agrícola (UFyMA); ArgentinaFacultad de Ciencias Agropecuarias, Universidad Nacional de Córdoba2026-04-06T14:35:42Z2026-04-06T14:35:42Z2023-10info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfhttp://hdl.handle.net/20.500.12123/25683https://revistas.unc.edu.ar/index.php/agris/article/view/408711668-298Xhttps://doi.org/10.31047/1668.298x.v40.n2.40871AgriScientia 40 (2) : 37-48. (2023)reponame:INTA Digital (INTA)instname:Instituto Nacional de Tecnología Agropecuariaspainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)2026-05-07T11:53:14Zoai:localhost:20.500.12123/25683instacron:INTAInstitucionalhttp://repositorio.inta.gob.ar/Organismo científico-tecnológicoNo correspondehttp://repositorio.inta.gob.ar/oai/requesttripaldi.nicolas@inta.gob.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:l2026-05-07 11:53:14.831INTA Digital (INTA) - Instituto Nacional de Tecnología Agropecuariafalse |
| dc.title.none.fl_str_mv |
Comparación de procedimientos de selección de variables para la modelación de la relación clima-patógenos en cultivos |
| title |
Comparación de procedimientos de selección de variables para la modelación de la relación clima-patógenos en cultivos |
| spellingShingle |
Comparación de procedimientos de selección de variables para la modelación de la relación clima-patógenos en cultivos Suarez, Franco Clima Organismos Patógenos Regresión de Paso Cauteloso Análisis de la Regresión Métodos Estadísticos Climate Pathogens Stepwise Regression Regression Analysis Statistical Methods |
| title_short |
Comparación de procedimientos de selección de variables para la modelación de la relación clima-patógenos en cultivos |
| title_full |
Comparación de procedimientos de selección de variables para la modelación de la relación clima-patógenos en cultivos |
| title_fullStr |
Comparación de procedimientos de selección de variables para la modelación de la relación clima-patógenos en cultivos |
| title_full_unstemmed |
Comparación de procedimientos de selección de variables para la modelación de la relación clima-patógenos en cultivos |
| title_sort |
Comparación de procedimientos de selección de variables para la modelación de la relación clima-patógenos en cultivos |
| dc.creator.none.fl_str_mv |
Suarez, Franco Bruno, Cecilia Gimenez, Maria De La Paz Balzarini, Mónica Graciela |
| author |
Suarez, Franco |
| author_facet |
Suarez, Franco Bruno, Cecilia Gimenez, Maria De La Paz Balzarini, Mónica Graciela |
| author_role |
author |
| author2 |
Bruno, Cecilia Gimenez, Maria De La Paz Balzarini, Mónica Graciela |
| author2_role |
author author author |
| dc.subject.none.fl_str_mv |
Clima Organismos Patógenos Regresión de Paso Cauteloso Análisis de la Regresión Métodos Estadísticos Climate Pathogens Stepwise Regression Regression Analysis Statistical Methods |
| topic |
Clima Organismos Patógenos Regresión de Paso Cauteloso Análisis de la Regresión Métodos Estadísticos Climate Pathogens Stepwise Regression Regression Analysis Statistical Methods |
| dc.description.none.fl_txt_mv |
Hoy es posible acceder fácilmente a cuantiosos volúmenes de datos climáticos georreferenciados. Éstos pueden ser usados para modelar la relación entre condiciones climáticas y enfermedad, para lo cual es necesario usar múltiples variables meteorológicas, usualmente correlacionadas y redundantes. La selección de variables permite identificar un subconjunto de regresoras relevantes para construir modelos predictivos. Stepwise, Boruta y LASSO son procedimientos de selección de variables de distinta naturaleza por lo que su desempeño relativo ha sido poco explorado. El objetivo de este trabajo fue la comparación de estos métodos aplicados simultáneamente en la construcción de modelos de regresión para predecir riesgo de enfermedad desde datos climáticos. Se utilizaron tres bases de datos georreferenciados con valores de presencia/ausencia de distintos patógenos en cultivos de maíz en Argentina. Para cada escenario se obtuvieron variables climáticas del periodo previo a la siembra hasta la cosecha. Con los tres métodos se generaron modelos predictivos con precisión de clasificación cercana al 70 %. LASSO produjo mejor predicción, seleccionando una cantidad intermedia de variables respecto a Stepwise (menor cantidad) y a Boruta (mayor). Los resultados podrían extenderse a otros patosistemas y contribuir a la construcción de sistemas de alarma basados en variables climáticas Nowadays it is possible to easily access large volumes of georeferenced climatic data. These data can be used to model the relationship between climatic conditions and disease from multiple meteorological variables, usually correlated and redundant. The selection of variables allows the identification of a subset of relevant regressors to build predictive models. Stepwise, Boruta, and LASSO are variable selection procedures of different nature, so their relative performance has been scarcely explored. The objective of this work was the comparison of these methods simultaneously applied in the construction of regression models to predict disease risk from climatic data. Three georeferenced databases were used with presence/absence values of different pathogens in maize crops in Argentina. For each scenario, climatic variables from the period prior to sowing until harvest were obtained. The three variable selection methods obtained models with accuracy close to 70 %. However, LASSO produced the best predictive model, selecting an intermediate number of variables with respect to Stepwise (lower number) and Boruta (higher number). The results could be extended to other pathosystems and inspire the construction of alarm systems based on climatic variables. Instituto de Patología Vegetal Fil: Suarez, Franco. Instituto Nacional de Tecnología Agropecuaria (INTA). Instituto de Patología Vegetal; Argentina Fil: Suarez, Franco. Consejo Nacional de Investigaciones Científicas y Técnicas. Unidad de Fitopatología y Modelización Agrícola (UFyMA); Argentina Fil: Bruno, Cecilia. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina Fil: Bruno, Cecilia. Instituto Nacional de Tecnología Agropecuaria (INTA). Instituto de Patología Vegetal; Argentina Fil: Bruno, Cecilia. Consejo Nacional de Investigaciones Científicas y Técnicas. Unidad de Fitopatología y Modelización Agrícola (UFyMA); Argentina Fil: Gimenez, Maria De La Paz. Instituto Nacional de Tecnología Agropecuaria (INTA). Instituto de Patología Vegetal; Argentina Fil: Gimenez, Maria De La Paz. Consejo Nacional de Investigaciones Científicas y Técnicas. Unidad de Fitopatología y Modelización Agrícola (UFyMA); Argentina Fil: Balzarini, Mónica Graciela. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina Fil: Balzarini, Mónica Graciela. Instituto Nacional de Tecnología Agropecuaria (INTA). Instituto de Patología Vegetal; Argentina Fil: Balzarini, Mónica Graciela. Consejo Nacional de Investigaciones Científicas y Técnicas. Unidad de Fitopatología y Modelización Agrícola (UFyMA); Argentina |
| description |
Hoy es posible acceder fácilmente a cuantiosos volúmenes de datos climáticos georreferenciados. Éstos pueden ser usados para modelar la relación entre condiciones climáticas y enfermedad, para lo cual es necesario usar múltiples variables meteorológicas, usualmente correlacionadas y redundantes. La selección de variables permite identificar un subconjunto de regresoras relevantes para construir modelos predictivos. Stepwise, Boruta y LASSO son procedimientos de selección de variables de distinta naturaleza por lo que su desempeño relativo ha sido poco explorado. El objetivo de este trabajo fue la comparación de estos métodos aplicados simultáneamente en la construcción de modelos de regresión para predecir riesgo de enfermedad desde datos climáticos. Se utilizaron tres bases de datos georreferenciados con valores de presencia/ausencia de distintos patógenos en cultivos de maíz en Argentina. Para cada escenario se obtuvieron variables climáticas del periodo previo a la siembra hasta la cosecha. Con los tres métodos se generaron modelos predictivos con precisión de clasificación cercana al 70 %. LASSO produjo mejor predicción, seleccionando una cantidad intermedia de variables respecto a Stepwise (menor cantidad) y a Boruta (mayor). Los resultados podrían extenderse a otros patosistemas y contribuir a la construcción de sistemas de alarma basados en variables climáticas |
| publishDate |
2023 |
| dc.date.none.fl_str_mv |
2023-10 2026-04-06T14:35:42Z 2026-04-06T14:35:42Z |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_6501 info:ar-repo/semantics/articulo |
| format |
article |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
http://hdl.handle.net/20.500.12123/25683 https://revistas.unc.edu.ar/index.php/agris/article/view/40871 1668-298X https://doi.org/10.31047/1668.298x.v40.n2.40871 |
| url |
http://hdl.handle.net/20.500.12123/25683 https://revistas.unc.edu.ar/index.php/agris/article/view/40871 https://doi.org/10.31047/1668.298x.v40.n2.40871 |
| identifier_str_mv |
1668-298X |
| dc.language.none.fl_str_mv |
spa |
| language |
spa |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Facultad de Ciencias Agropecuarias, Universidad Nacional de Córdoba |
| publisher.none.fl_str_mv |
Facultad de Ciencias Agropecuarias, Universidad Nacional de Córdoba |
| dc.source.none.fl_str_mv |
AgriScientia 40 (2) : 37-48. (2023) reponame:INTA Digital (INTA) instname:Instituto Nacional de Tecnología Agropecuaria |
| reponame_str |
INTA Digital (INTA) |
| collection |
INTA Digital (INTA) |
| instname_str |
Instituto Nacional de Tecnología Agropecuaria |
| repository.name.fl_str_mv |
INTA Digital (INTA) - Instituto Nacional de Tecnología Agropecuaria |
| repository.mail.fl_str_mv |
tripaldi.nicolas@inta.gob.ar |
| _version_ |
1864547142079610880 |
| score |
13.1485815 |