Prueba de homogeneidad de la dispersión
para datos de proporción sobredispersos
mediante regresión beta

MARIO MORALES a,*, JOSE LOZANOb
a Universidad de Córdoba, Departamento de Matemáticas y Estadística, Montería, Colombia.
b Universidad de Antioquia, Sede de Investigación Universitaria SIU, Medellín, Colombia.


Resumen. En este artículo se propone un procedimiento para verificar la hipótesis de homogeneidad del parámetro de dispersión usando regresión beta, cuando se tienen datos de proporción sobredispersos. Se demuestra que es posible analizar este tipo de datos usando un modelo lineal generalizado usual ponderado, con pesos obtenidos mediante la regresión beta. Esta forma de proceder permite corregir el problema de la dispersión extra, manteniendo la sencillez del análisis.

Además, para algunos casos particulares, se evalúa mediante un estudio de simulación, la potencia de la prueba.

Palabras claves: Sobredispersión, datos de proporción, regresión beta, razón de verosimilitud, modelos lineales generalizados.
MSC2010: 62-07, 62J05, 62J12.


Test for homogeneity of the dispersion for
overdispersed proportions data
through beta regression

Abstract.. In this paper we propose an approach to validate the hypothesis of homogeneity of the dispersion parameter using beta regression, when we have overdispersed proportions data. We corroborated that it is possible to analyze this type of data with an usual weighted generalized linear model, weighting the observations with weights obtained through beta regression. This procedure allows to correct the problem of overdispersion keeping the simplicity of the analysis.

Furthermore, for several cases, we made a simulation study of the power of the test.

Keywords: Overdispersion, proportion data, beta regression, likelihood ratio, generalized linear models.


Texto Completo disponible en PDF


Referencias

[1] Atkison A., Plots, Tranformations and Regression: An Introduction to Graphical Methods of Diagnostic Regression Analysis, Oxford University Press, New York, 1985.

[2] Barrios D.E. y Peña E., "Obtención de un empaque antimicrobiano a partir de almidon de ñame con adición de sorbato de potasio para su aplicación en la conservación de ñame minimamente procesado", Tesis, Programa de Ingeniería de Alimentos, Universidad de Córdoba, 2009.

[3] Brooks R.J., "Approximate Likelihood-Ratio Test in the Analysis of Beta-Binomial Data", Stat. Appl. 12 (1978), 1589-1596.

[4] Cox D.R. and Hinkley D.V., Theoretical Statistics, Chapman & Hall, London, 1974.

[5] Cook R.D., "Detection of Influencial Observations in Linear Regression", Technometrics 19 (1977), 15-18.

[6] Crowder M.J. "Beta-Binomial Anova for Proportions", Appl. Stat. 27 (1978), no. 1, 34-37.

[7] Crowder M.J., "Inference About the Intraclass Correlation Coefficient in the Beta-binomial ANOVA for Proportions", J. R. Stat. Soc. 41 (1979), no. 2, 230-234.

[8] Dobson A.J., An Introduction to Generalized Linear Models, Chapman & Hall/CRC, New York, 2 ed., 2002.

[9] Ferrari S.L.P. and Cribari-Neto F., "Beta Regression for Modelling Rates and Proportions", J. Appl. Stat. 31 (2004), no. 7, 799-815.

[10] Gordon K.S., Optimization and Nonlinear Equations, Encyclopedia of Biostatistics, Chichester, 1998.

[11] Hinde J. and Demétrio C., Overdispersion: Models and Estimation, ABE, São Pablo, 1998.

[12] Nocedal J. and Wright S.J., Numerical Optimization, Springer-Verlag, New York, 1999.

[13] McCullagh P. and Nelder J., Generalized Linear Models, Chapmann & Hall/CRC, New York, 1989.

[14] Mood A., Graybill F., and Boes D., Introduction to the theory of statistics, McGraw-Hill, 3 ed., 1974.

[15] Moore D.F. and Tsiatis A., "Robust Estimation of the Variance in Moment Methods for Extra-binomial and Extra-Poisson Variation", Biometrics 47 (1991), 383-401.

[16] Morales M.A. & López L.A., "Estudio de homogeneidad de la dispersión en diseño a una vía de clasificación para datos de proporciones y conteos", Rev. Colombiana Estadíst. 32 (2009), no. 1, 59-78.

[17] Nelder J.A. and Wedderburn D.W.M., "Generalized Linear Models", J. R. Stat. Soc. Ser. A 135 (1972), no. 3, 370-384.

[18] Press W.H., Teukolsky S.A., Vetterling W.T., and Flannery B.P., Numerical recipes in C: the art of scientific computing, Cambridge University Press, New York, 2 edition, 1992.

[19] R Development Core Team. R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, Austria, 2012, URL http://www.r-project.org.

[20] Ravishanker N. and Dey D.K., A First Course in Linear Model Theory, Chapman & Hall/CRC, New York, 2001.

[21] Simas A., Barreto-Souza W., and Rocha A., "Improved Estimators for a General Class of Beta Regression Models", Comput. Statist. Data Anal. 54 (2010), no. 2, 348-366.

[22] Smithson M. and Verkuilen J., "A Better Lemon Squeezer? Maximum-Likelihood Regression with Beta-Distributed Depedent Variables", Psychological Methods 11 (2006), no. 1, 54-71.


* Autor para correspondencia: E-mail: mamorales@correo.unicordoba.edu.co.
Recibido: 30 de septiembre de 2013, Aceptado: 28 de marzo de 2014.
Para citar este artículo: M. Morales, J. Lozano, Prueba de homogeneidad de la dispersión para datos de
proporción sobredispersos mediante regresión beta, Rev. Integr. Temas Mat. 32 (2014), no. 1, 55-70.