En primer lugar se presenta un estudio bibliométrico con el objetivo de evaluar la frecuencia de uso de las variables de recuento en diferentes ámbitos de investigación en Psicología, así como los modelos de análisis que se aplican habitualmente a los datos de recuentos Para ello se selecciona una muestra de 168 artículos procedentes de dos de las diez revistas con mayor índice de impacto asignado por el ISI (índice JCR-SCI) para cada ámbito de aplicación en Psicología. Los resultados muestran que las variables de recuento son de uso habitual en Psicología, puesto que aparecen en un 38.1% de los artículo revisados, y que existe una aplicación masiva del modelo lineal general mientras que no se aplican modelos específicos para datos de recuento. Una vez establecida la importante presencia de las variables de recuento en Psicología y constatado el notable problema de la aplicación de modelos estadísticos no adecuados para datos de recuentos, se expone la propuesta, ya conocida aunque poco aplicada en Psicología, de analizar los datos a través del modelado. De esta forma, y después de discutir las características del modelado desde un punto de vista epistemológico, se repasan las características básicas del modelado estadístico así como del modelo lineal generalizado (MLG) puesto que forman parte de las bases teóricas de este trabajo. A continuación se expone las características distribucionales de las variables de recuento que permiten justificar la aplicación de modelos lineales generalizados adecuados para este tipo de variables. Así, en primer lugar se describe la distribución de Poisson así como el modelo de regresión de referencia en el ámbito de los recuentos: el modelo de regresión de Poisson (MRP). La restrictividad impuesta por los supuestos en los que se basa el MRP provocan que su ámbito de aplicación sea restringido a un conjunto de situaciones que resultan poco habituales en la práctica. La más importante de tales situaciones es la de equidispersión. En ausencia de equidispersión la situación más habitual es la sobredispersión. En presencia de sobredispersión deben aplicarse modelos o procedimientos que permitan modelar la causa de sobredispersión, que sean menos restrictivos en cuanto a la igualdad media-variancia condicionales o bien que corrijan el error estándar de las estimaciones del modelo de regresión de Poisson. Sin embargo, existe un paso previo que resulta de vital importancia: la detección de la sobredispersión. Para ello se exponen un conjunto de métodos de diagnóstico de sobredispersión. En la parte empírica, se estudian diversos aspectos relacionados con el diagnóstico y el tratamiento de la sobredispersión, que se concretan el estudio de la tasa nominal de error y de potencia de las pruebas diagnósticas de sobredispersión; la comparación de procedimientos para la corrección del error estándar de las estimaciones del MRP en presencia de sobredispersión y, adicionalmente se comprueba la incidencia de la sobredispersión sobre las estimaciones de los coeficientes y de sus errores estándar. Para cubrir estos objetivos se han implementado 5 experimentos de simulación Monte Carlo en el entorno R, y han sido organizados en 3 estudios. En cuanto a los resultados, destaca la eficiencia, consistencia y potencia de las pruebas LR y c2 así como superioridad de las estimaciones bootstrap y jackknife para la corrección del error estándar.
El diagnóstico de la sobredispersión en modelos de análisis de datos de recuento
Vives Brosa, J. (Autor/a). 5 sept 2002
Tesis doctoral