Análisis de la covarianza

De testwiki
Ir a la navegación Ir a la búsqueda

El análisis de la covarianza o ANCOVA, acrónimo del inglés analysis of covariance, es un modelo lineal general con una variable cuantitativa y uno o más factores. El ANCOVA es una fusión del ANOVA y de la regresión lineal múltiple. Es un procedimiento estadístico que permite eliminar la heterogeneidad causada en la variable de interés (variable dependiente) por la influencia de una o más variables cuantitativas (covariables). Básicamente, el fundamento del ANCOVA es un ANOVA al que a la variable dependiente se le ha eliminado el efecto predicho por una o más covariables por regresión lineal múltiple. La inclusión de covariables puede aumentar la potencia estadística porque a menudo reduce la variabilidad.

Ecuaciones

ANCOVA de un factor

El análisis de un factor es apropiado cuando se dispone de tres o más grupos. En los diseños equilibrados, cada grupo tiene el mismo número de datos (individuos), los cuales idealmente han sido asignados al azar a cada grupo a partir de una muestra original preferiblemente homogénea.

Calculando la suma de las desviaciones al cuadrado para la variable independiente X y la variable dependiente Y

Las sumas de las desviaciones al cuadrado o sumas de cuadrados (SS): SSTy, SSTry, y SSEy deben ser calculadas usando las siguientes ecuaciones para la variable dependiente, Y. La SS para la covariable también debe ser calculada; los dos valores necesarios son SSTx y SSEx.

La suma de cuadrados total define una la variabilidad del total de individuos nT:

SSTy=i=1nj=1kYij2(i=1nj=1kYij)2nT

La suma de cuadrados para los tratamientos define la variabilidad entre las poblaciones o grupos. k representa el número de grupos.

SSTry=i=1n(j=1kYij2k)(i=1nj=1kYij)2nT

La suma de cuadrados del error define la variabilidad residual dentro de cada grupo. nn representa el número de individuos en un grupo dado:

SSEy=i=1nj=1kYij2i=1n(j=1kYij2nk)

La suma de cuadrados total es igual a la suma de cuadrados de los tratamientos y la suma de cuadrados del error (propiedad de aditividad de las sumas de cuadrados y de los grados de libertad, característica del ANOVA).

SSTy=SSTry+SSEy.

Cálculo de la covarianza de X e Y

La sumas de las covarianzas (SCT y SCE) definen la covarianza de X e Y.

SCT=i=1nj=1kXijYij(i=1nj=1kXij)(i=1nj=1kYij)nT
SCE=j=1k(i=1nXijYiji=1n(XijYij)nn)

Ajuste de SSTy

Las correlaciones entre X e Y son rT para el total y rn para el error.

rT=SCTSSTxSSTy
rn=SCESSExSSEy

La proporción de covarianza es sustraída de la dependiente; valores de SSy:

SSTy(adj)=SSTySSTy(rT)2
SSEy(adj)=SSEySSEy(rn)2
SSTry(adj)=SSTy(adj)SSEy(adj)

Ajuste de las medias de cada grupo k

La media de cada grupo es ajustada del siguiente modo:

Myi(adj)=MyiSCEySCEx(MxiMxT)

Análisis usando los valores de la suma de cuadrados

Finalmente obtenemos la varianza de los tratamientos libre de la covarianza, donde dfTr (grados de libertad de los tratamientos) es igual a k1 y dfE (grados de libertad del error) es igual a nTk1. Puede apreciarse que cada covariable elimina un grado de libertad.

MSTr=SSTrdfTr
MSE=SSEdfE

El estadístico F se obtiene de:

FdfE,dfTr=MSTrMSE

Véase también

Enlaces externos


Plantilla:Control de autoridades