La reciente aparición en el Alto Valle (Argentina) de la enfermedad producida por
el hongo Stemphylium vesicarium ha motivado este estudio, cuya principal
característica es que los datos resultan de conteos de lesiones (manchas en los
frutos) y en particular, los analizados presentan sobredispersión. La variable de
respuesta en ellos es de naturaleza discreta y no negativa. En el caso de los
datos de conteo, el modelo de referencia comúnmente usado es el Modelo de
regresión Poisson, que, en presencia de sobredispersión no resulta adecuado
por no cumplirse los supuestos de igualdad media-varianza. Para ello, se
contemplan una variedad de modelos que intentan dar cuenta de esa
sobredispersión: el modelo binomial negativo, modelos inflados con ceros,
modelos Hurdle y modelos Conway-Maxwell-Poisson. Esta tesis analiza la
aplicabilidad de los Modelos Lineales Generalizados Mixtos (MLGM) a datos
de conteo sobredispersos. Los MLGM son una extensión de los Modelos
Lineales Generalizados (MLG) cuando se le adicionan efectos aleatorios que
permiten considerar la correlación de las observaciones que fueron tomadas
en la misma planta en diferentes momentos. La implementación del paquete
“glmmTMB” del software estadístico R posibilitó ampliar la gama de modelos
analizados con el paquete “lme4” de R permitiendo así ajustarlos a todos
rápidamente con un único paquete.
The recent appearance in the Alto Valle (Argentina) of the disease caused by the
fungus Stemphylium vesicarium has motivated the study of this phenomenon
whose main characteristic is that the data result from counts of lesions (counts of
spots on the fruits) and from the analyzed show overdispersion. The response
variable in them is therefore of a discrete and non-negative nature. In the case of
counting data, the commonly used reference model is the Poisson regression
model, but in the presence of overdispersion it is no longer adequate because the
assumptions of equality of means, and variances are not fulfilled. To do this, a
variety of models are considered that try to account for this overdispersion: the
negative binomial model, the zero-inflated models, the Hurdle models, and the
Conway-Maxwell-Poisson models. This thesis analyzes the applicability of
Generalized Linear Mixed Models (MLGM) to overdispersed count data. The
GMLM are an extension of the Generalized Linear Models (MLG) when random
effects are added that allow considering the correlation of the observations that
were taken in the same plant at different times. The implementation of the
"glmmTMB" package of the R statistical software allowed to expand the range of
models analyzed with the R package "lme4", thus allowing them to be adjusted
quickly with a single package.