Distribución T² de Hotelling

De testwiki
Ir a la navegación Ir a la búsqueda
Función de densidad de probabilidad.Parámetros:p - dimensión de las variables aleatorias.m - relacionado con el tamaño de la muestra.

En estadística la distribución T² (T-cuadrado) de Hotelling es importante porque se presenta como la distribución de un conjunto de estadísticas que son una generalización natural de las estadísticas subayacentes distribución t de Student. En particular, la distribución se presenta en estadísticas multivariadas en pruebas de diferencias entre las medias (multivariadas) de diferentes poblaciones, donde las pruebas para problemas univariados usarían la Prueba t. Es proporcional a la distribución F.

La distribución recibe su nombre de Harold Hotelling, quien la desarrollo[1] como una generalización de la distribución t de Student.

Definición

Si el vector d tiene distribución normal multivariada con media cero y matriz de covarianza unitaria N(0p,𝑰p,p) y M es una matriz de tamaño p×p con matriz unitaria escalada y m los grados de libertad con distribución de Wishart W(𝑰p,p,m) entonces la forma cuadrática X tiene distribución de Hotelling con parámetros p y m:

X=mdTM1dT2(p,m)

Si la variable aleatoria X tiene distribución T-cuadrado de Hotelling con parámetros p y m, XTp,m2, entonces

mp+1pmXFp,mp+1

donde Fp,mp+1 es la distribución F con parámetros p y mp+1.

Estadística T-cuadrado de Hotelling

La estadística T-cuadrado de Hotelling es una generalización de la estadística t de Student que se usa en las pruebas de hipótesis multivariadas, y se define como sigue:[1]

Sea 𝒩p(μ,Σ), que denota una distribución normal p-variada con vector de medias μ y covarianza Σ. Sean

𝐱1,,𝐱n𝒩p(μ,Σ)

n variables aleatorias independientes, las cuales pueden representarse como un vector columna de orden p×1 de números reales. Defínase

𝐱=𝐱1++𝐱nn

como la media muestral. Puede demostrarse que

n(𝐱μ)Σ1(𝐱μ)χp2,

donde χp2 es una distribución ji-cuadrado con p grados de libertad. Para demostrar eso se usa el hecho que 𝐱𝒩p(μ,Σ/n) y entonces, al derivar la función característica de la variable aleatoria 𝐲=n(𝐱μ)Σ1(𝐱μ)

ϕ𝐲(θ)=Eeiθ𝐲=Eeiθn(𝐱μ)Σ1(𝐱μ)=eiθn(𝐱μ)Σ1(𝐱μ)(2π)p2|Σ/n|12e12n(𝐱μ)Σ1(𝐱μ)dx1...dxp=(2π)p2|Σ/n|12e12n(𝐱μ)(Σ12iθΣ1)(𝐱μ)dx1...dxp=|(Σ12iθΣ1)1/n|12|Σ/n|12(2π)p2|(Σ12iθΣ1)1/n|12e12n(𝐱μ)(Σ12iθΣ1)(𝐱μ)dx1...dxp=|(𝐈p2iθ𝐈p)|12=(12iθ)p2

Sin embargo, Σ es por lo general desconocida y se busca hacer una prueba de hipótesis sobre el vector de medias μ.

Defínase

𝐖=1n1i=1n(𝐱i𝐱)(𝐱i𝐱)

como la covarianza muestral. La traspuesta se ha denotado con un apóstrofo. Se demuestra que 𝐖 es una matriz definida positiva y (n1)𝐖 sigue una distribución Wishart p-variada con n−1 grados de libertad.[2] La estadística T-cuadrado de Hotelling se define entonces como

t2=n(𝐱μ)𝐖1(𝐱μ)

porque se demuestra que Plantilla:Citation needed

t2Tp,n12

es decir

npp(n1)t2Fp,np,

donde Fp,np es una distribución F con parámetros p y np. Para calcular un p-valor, multiplique la estadística t2 y la constante anterior y use la distribución F.

Referencias

Plantilla:Listaref

Plantilla:Control de autoridades

  1. 1,0 1,1 Plantilla:Cita publicación
  2. K.V. Mardia, J.T. Kent, and J.M. Bibby (1979) Multivariate Analysis, Academic Press.