Modelación de variables de respuesta de conteo con sobredispersión mediante modelos lineales generalizados mixtos

Autores
Basanta Fernandez, Mabel Elizabeth
Año de publicación
2023
Idioma
español castellano
Tipo de recurso
tesis doctoral
Estado
versión aceptada
Colaborador/a o director/a de tesis
Giménez, Gustavo Néstor
Rubio, Natalia
Descripción
La reciente aparición en el Alto Valle (Argentina) de la enfermedad producida por el hongo Stemphylium vesicarium ha motivado este estudio, cuya principal característica es que los datos resultan de conteos de lesiones (manchas en los frutos) y en particular, los analizados presentan sobredispersión. La variable de respuesta en ellos es de naturaleza discreta y no negativa. En el caso de los datos de conteo, el modelo de referencia comúnmente usado es el Modelo de regresión Poisson, que, en presencia de sobredispersión no resulta adecuado por no cumplirse los supuestos de igualdad media-varianza. Para ello, se contemplan una variedad de modelos que intentan dar cuenta de esa sobredispersión: el modelo binomial negativo, modelos inflados con ceros, modelos Hurdle y modelos Conway-Maxwell-Poisson. Esta tesis analiza la aplicabilidad de los Modelos Lineales Generalizados Mixtos (MLGM) a datos de conteo sobredispersos. Los MLGM son una extensión de los Modelos Lineales Generalizados (MLG) cuando se le adicionan efectos aleatorios que permiten considerar la correlación de las observaciones que fueron tomadas en la misma planta en diferentes momentos. La implementación del paquete “glmmTMB” del software estadístico R posibilitó ampliar la gama de modelos analizados con el paquete “lme4” de R permitiendo así ajustarlos a todos rápidamente con un único paquete.
The recent appearance in the Alto Valle (Argentina) of the disease caused by the fungus Stemphylium vesicarium has motivated the study of this phenomenon whose main characteristic is that the data result from counts of lesions (counts of spots on the fruits) and from the analyzed show overdispersion. The response variable in them is therefore of a discrete and non-negative nature. In the case of counting data, the commonly used reference model is the Poisson regression model, but in the presence of overdispersion it is no longer adequate because the assumptions of equality of means, and variances are not fulfilled. To do this, a variety of models are considered that try to account for this overdispersion: the negative binomial model, the zero-inflated models, the Hurdle models, and the Conway-Maxwell-Poisson models. This thesis analyzes the applicability of Generalized Linear Mixed Models (MLGM) to overdispersed count data. The GMLM are an extension of the Generalized Linear Models (MLG) when random effects are added that allow considering the correlation of the observations that were taken in the same plant at different times. The implementation of the "glmmTMB" package of the R statistical software allowed to expand the range of models analyzed with the R package "lme4", thus allowing them to be adjusted quickly with a single package.
Fil: Basanta Fernandez, Mabel Elizabeth. Universidad Nacional del Comahue. Facultad de Economía y Administración; Argentina.
Materia
MLGM
Modelo binomial negativo
Modelo hurdle
Modelo inflado con cero
GlmmTMB
Conteo de lesiones
Negative binomial model
Obstacle model
Inflated zero model
Lesion count
Ciencias de la Administración y Economía
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
Repositorio Digital Institucional (UNCo)
Institución
Universidad Nacional del Comahue
OAI Identificador
oai:rdi.uncoma.edu.ar:uncomaid/17833

id RDIUNCO_64264e42db93a33788430771c2409aff
oai_identifier_str oai:rdi.uncoma.edu.ar:uncomaid/17833
network_acronym_str RDIUNCO
repository_id_str 7108
network_name_str Repositorio Digital Institucional (UNCo)
spelling Modelación de variables de respuesta de conteo con sobredispersión mediante modelos lineales generalizados mixtosBasanta Fernandez, Mabel ElizabethMLGMModelo binomial negativoModelo hurdleModelo inflado con ceroGlmmTMBConteo de lesionesNegative binomial modelObstacle modelInflated zero modelLesion countCiencias de la Administración y EconomíaLa reciente aparición en el Alto Valle (Argentina) de la enfermedad producida por el hongo Stemphylium vesicarium ha motivado este estudio, cuya principal característica es que los datos resultan de conteos de lesiones (manchas en los frutos) y en particular, los analizados presentan sobredispersión. La variable de respuesta en ellos es de naturaleza discreta y no negativa. En el caso de los datos de conteo, el modelo de referencia comúnmente usado es el Modelo de regresión Poisson, que, en presencia de sobredispersión no resulta adecuado por no cumplirse los supuestos de igualdad media-varianza. Para ello, se contemplan una variedad de modelos que intentan dar cuenta de esa sobredispersión: el modelo binomial negativo, modelos inflados con ceros, modelos Hurdle y modelos Conway-Maxwell-Poisson. Esta tesis analiza la aplicabilidad de los Modelos Lineales Generalizados Mixtos (MLGM) a datos de conteo sobredispersos. Los MLGM son una extensión de los Modelos Lineales Generalizados (MLG) cuando se le adicionan efectos aleatorios que permiten considerar la correlación de las observaciones que fueron tomadas en la misma planta en diferentes momentos. La implementación del paquete “glmmTMB” del software estadístico R posibilitó ampliar la gama de modelos analizados con el paquete “lme4” de R permitiendo así ajustarlos a todos rápidamente con un único paquete.The recent appearance in the Alto Valle (Argentina) of the disease caused by the fungus Stemphylium vesicarium has motivated the study of this phenomenon whose main characteristic is that the data result from counts of lesions (counts of spots on the fruits) and from the analyzed show overdispersion. The response variable in them is therefore of a discrete and non-negative nature. In the case of counting data, the commonly used reference model is the Poisson regression model, but in the presence of overdispersion it is no longer adequate because the assumptions of equality of means, and variances are not fulfilled. To do this, a variety of models are considered that try to account for this overdispersion: the negative binomial model, the zero-inflated models, the Hurdle models, and the Conway-Maxwell-Poisson models. This thesis analyzes the applicability of Generalized Linear Mixed Models (MLGM) to overdispersed count data. The GMLM are an extension of the Generalized Linear Models (MLG) when random effects are added that allow considering the correlation of the observations that were taken in the same plant at different times. The implementation of the "glmmTMB" package of the R statistical software allowed to expand the range of models analyzed with the R package "lme4", thus allowing them to be adjusted quickly with a single package.Fil: Basanta Fernandez, Mabel Elizabeth. Universidad Nacional del Comahue. Facultad de Economía y Administración; Argentina.Universidad Nacional del Comahue. Facultad de Economía y AdministraciónGiménez, Gustavo NéstorRubio, Natalia2023info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfapplication/pdfhttp://rdi.uncoma.edu.ar/handle/uncomaid/17833spaARGinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:Repositorio Digital Institucional (UNCo)instname:Universidad Nacional del Comahue2025-10-23T11:16:47Zoai:rdi.uncoma.edu.ar:uncomaid/17833instacron:UNCoInstitucionalhttp://rdi.uncoma.edu.ar/Universidad públicaNo correspondehttp://rdi.uncoma.edu.ar/oaimirtha.mateo@biblioteca.uncoma.edu.ar; adriana.acuna@biblioteca.uncoma.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:71082025-10-23 11:16:47.972Repositorio Digital Institucional (UNCo) - Universidad Nacional del Comahuefalse
dc.title.none.fl_str_mv Modelación de variables de respuesta de conteo con sobredispersión mediante modelos lineales generalizados mixtos
title Modelación de variables de respuesta de conteo con sobredispersión mediante modelos lineales generalizados mixtos
spellingShingle Modelación de variables de respuesta de conteo con sobredispersión mediante modelos lineales generalizados mixtos
Basanta Fernandez, Mabel Elizabeth
MLGM
Modelo binomial negativo
Modelo hurdle
Modelo inflado con cero
GlmmTMB
Conteo de lesiones
Negative binomial model
Obstacle model
Inflated zero model
Lesion count
Ciencias de la Administración y Economía
title_short Modelación de variables de respuesta de conteo con sobredispersión mediante modelos lineales generalizados mixtos
title_full Modelación de variables de respuesta de conteo con sobredispersión mediante modelos lineales generalizados mixtos
title_fullStr Modelación de variables de respuesta de conteo con sobredispersión mediante modelos lineales generalizados mixtos
title_full_unstemmed Modelación de variables de respuesta de conteo con sobredispersión mediante modelos lineales generalizados mixtos
title_sort Modelación de variables de respuesta de conteo con sobredispersión mediante modelos lineales generalizados mixtos
dc.creator.none.fl_str_mv Basanta Fernandez, Mabel Elizabeth
author Basanta Fernandez, Mabel Elizabeth
author_facet Basanta Fernandez, Mabel Elizabeth
author_role author
dc.contributor.none.fl_str_mv Giménez, Gustavo Néstor
Rubio, Natalia
dc.subject.none.fl_str_mv MLGM
Modelo binomial negativo
Modelo hurdle
Modelo inflado con cero
GlmmTMB
Conteo de lesiones
Negative binomial model
Obstacle model
Inflated zero model
Lesion count
Ciencias de la Administración y Economía
topic MLGM
Modelo binomial negativo
Modelo hurdle
Modelo inflado con cero
GlmmTMB
Conteo de lesiones
Negative binomial model
Obstacle model
Inflated zero model
Lesion count
Ciencias de la Administración y Economía
dc.description.none.fl_txt_mv La reciente aparición en el Alto Valle (Argentina) de la enfermedad producida por el hongo Stemphylium vesicarium ha motivado este estudio, cuya principal característica es que los datos resultan de conteos de lesiones (manchas en los frutos) y en particular, los analizados presentan sobredispersión. La variable de respuesta en ellos es de naturaleza discreta y no negativa. En el caso de los datos de conteo, el modelo de referencia comúnmente usado es el Modelo de regresión Poisson, que, en presencia de sobredispersión no resulta adecuado por no cumplirse los supuestos de igualdad media-varianza. Para ello, se contemplan una variedad de modelos que intentan dar cuenta de esa sobredispersión: el modelo binomial negativo, modelos inflados con ceros, modelos Hurdle y modelos Conway-Maxwell-Poisson. Esta tesis analiza la aplicabilidad de los Modelos Lineales Generalizados Mixtos (MLGM) a datos de conteo sobredispersos. Los MLGM son una extensión de los Modelos Lineales Generalizados (MLG) cuando se le adicionan efectos aleatorios que permiten considerar la correlación de las observaciones que fueron tomadas en la misma planta en diferentes momentos. La implementación del paquete “glmmTMB” del software estadístico R posibilitó ampliar la gama de modelos analizados con el paquete “lme4” de R permitiendo así ajustarlos a todos rápidamente con un único paquete.
The recent appearance in the Alto Valle (Argentina) of the disease caused by the fungus Stemphylium vesicarium has motivated the study of this phenomenon whose main characteristic is that the data result from counts of lesions (counts of spots on the fruits) and from the analyzed show overdispersion. The response variable in them is therefore of a discrete and non-negative nature. In the case of counting data, the commonly used reference model is the Poisson regression model, but in the presence of overdispersion it is no longer adequate because the assumptions of equality of means, and variances are not fulfilled. To do this, a variety of models are considered that try to account for this overdispersion: the negative binomial model, the zero-inflated models, the Hurdle models, and the Conway-Maxwell-Poisson models. This thesis analyzes the applicability of Generalized Linear Mixed Models (MLGM) to overdispersed count data. The GMLM are an extension of the Generalized Linear Models (MLG) when random effects are added that allow considering the correlation of the observations that were taken in the same plant at different times. The implementation of the "glmmTMB" package of the R statistical software allowed to expand the range of models analyzed with the R package "lme4", thus allowing them to be adjusted quickly with a single package.
Fil: Basanta Fernandez, Mabel Elizabeth. Universidad Nacional del Comahue. Facultad de Economía y Administración; Argentina.
description La reciente aparición en el Alto Valle (Argentina) de la enfermedad producida por el hongo Stemphylium vesicarium ha motivado este estudio, cuya principal característica es que los datos resultan de conteos de lesiones (manchas en los frutos) y en particular, los analizados presentan sobredispersión. La variable de respuesta en ellos es de naturaleza discreta y no negativa. En el caso de los datos de conteo, el modelo de referencia comúnmente usado es el Modelo de regresión Poisson, que, en presencia de sobredispersión no resulta adecuado por no cumplirse los supuestos de igualdad media-varianza. Para ello, se contemplan una variedad de modelos que intentan dar cuenta de esa sobredispersión: el modelo binomial negativo, modelos inflados con ceros, modelos Hurdle y modelos Conway-Maxwell-Poisson. Esta tesis analiza la aplicabilidad de los Modelos Lineales Generalizados Mixtos (MLGM) a datos de conteo sobredispersos. Los MLGM son una extensión de los Modelos Lineales Generalizados (MLG) cuando se le adicionan efectos aleatorios que permiten considerar la correlación de las observaciones que fueron tomadas en la misma planta en diferentes momentos. La implementación del paquete “glmmTMB” del software estadístico R posibilitó ampliar la gama de modelos analizados con el paquete “lme4” de R permitiendo así ajustarlos a todos rápidamente con un único paquete.
publishDate 2023
dc.date.none.fl_str_mv 2023
dc.type.none.fl_str_mv info:eu-repo/semantics/doctoralThesis
info:eu-repo/semantics/acceptedVersion
http://purl.org/coar/resource_type/c_db06
info:ar-repo/semantics/tesisDoctoral
format doctoralThesis
status_str acceptedVersion
dc.identifier.none.fl_str_mv http://rdi.uncoma.edu.ar/handle/uncomaid/17833
url http://rdi.uncoma.edu.ar/handle/uncomaid/17833
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.coverage.none.fl_str_mv ARG
dc.publisher.none.fl_str_mv Universidad Nacional del Comahue. Facultad de Economía y Administración
publisher.none.fl_str_mv Universidad Nacional del Comahue. Facultad de Economía y Administración
dc.source.none.fl_str_mv reponame:Repositorio Digital Institucional (UNCo)
instname:Universidad Nacional del Comahue
reponame_str Repositorio Digital Institucional (UNCo)
collection Repositorio Digital Institucional (UNCo)
instname_str Universidad Nacional del Comahue
repository.name.fl_str_mv Repositorio Digital Institucional (UNCo) - Universidad Nacional del Comahue
repository.mail.fl_str_mv mirtha.mateo@biblioteca.uncoma.edu.ar; adriana.acuna@biblioteca.uncoma.edu.ar
_version_ 1846787655754317824
score 12.982451