Distribución t de Student

De testwiki
Revisión del 22:48 31 ene 2025 de imported>BOT-Superzerocool (PR:CW: Referencia y punto)
(difs.) ← Revisión anterior | Revisión actual (difs.) | Revisión siguiente → (difs.)
Ir a la navegación Ir a la búsqueda

Plantilla:Ficha de distribución de probabilidad

En probabilidad y estadística, la distribución t (de Student) es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño y la desviación estándar poblacional es desconocida.

Fue desarrollada por William Sealy Gosset bajo el pseudónimo “Student”.

Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre dos varianzas muestrales y para la construcción del intervalo de confianza para la diferencia entre las partes de dos poblaciones cuando se desconoce la desviación típica de una población y esta debe ser estimada a partir de los datos de una muestra.

Historia y etimología

El estadístico William Sealy Gosset, conocido como "Student"

La distribución de Student fue descrita en el año 1908 por William Sealy Gosset.

En estadística, la distribución t fue derivada por primera vez como distribución posterior en 1876 por Helmert[1][2][3] y Lüroth.[4][5][6] La distribución t también apareció en una forma más general como distribución Pearson Tipo IV en el artículo de Karl Pearson de 1895.[7]

En la literatura en lengua inglesa, la distribución toma su nombre del artículo de William Sealy Gosset de 1908 en Biometrika bajo el seudónimo de "Student".[8] Una versión del origen del seudónimo es que el empleador de Gosset prefería que el personal utilizara seudónimos al publicar artículos científicos en lugar de su nombre real, o prohibía totalmente la publicación de artículos,[9] por lo que utilizó el nombre de "Estudiante" para ocultar su identidad. Otra versión es que Guinness no quería que sus competidores supieran que utilizaban la prueba t para determinar la calidad de la materia prima.[10][11]

Gosset trabajó en la fábrica de cerveza Guinness en Dublín, Irlanda, y se interesó por los problemas de las muestras pequeñas, por ejemplo, las propiedades químicas de la cebada, donde el tamaño de las muestras podía ser de sólo 3. El artículo de Gosset se refiere a la distribución como la "distribución de frecuencias de las desviaciones típicas de muestras extraídas de una población normal". Se hizo muy conocida gracias al trabajo de Ronald Fisher, que llamó a la distribución "distribución de Student" y representó el valor de la prueba con la letra t.[12][13]

Distribución t de Student a partir de una muestra aleatoria

Sea X1,,Xn variables aleatorias independientes distribuidas N(μ,σ2), esto es, X1,,Xn es una muestra aleatoria de tamaño n proveniente de una población con distribución normal con media μ y varianza σ2.

Sean

X=1ni=1nXi

la media muestral y

S2=1n1i=1n(XiX)2

la varianza muestral. Entonces, la variable aleatoria

Xμσ/n

sigue una distribución normal estándar (es decir, una distribución normal con media 0 y varianza 1) y la variable aleatoria

XμS/n

donde S ha sido sustituido por σ, tiene una distribución t de student con n1 grados de libertad.

Definición

Notación

Sean X una variable aleatoria continua y v>0, si X tiene una distribución t con v grados de libertad entonces escribiremos Xtv o Xt(v).

Función de densidad

La distribución t-student tiene como función de densidad

fX(x)=Γ(v+12)vπΓ(v2)(1+x2v)v+12

para x, donde v denota los grados de libertad y Γ es la función gamma.

La expresión anterior también suele escribirse como

fX(x)=1vB(12,v2)(1+x2v)v+12

donde B es la función beta.

En particular, para valores enteros de v se tiene que

para v>1 par

Γ(v+12)vπΓ(v2)=(v1)(v3)532v(v2)(v4)42

para v>1 impar

Γ(v+12)vπΓ(v2)=(v1)(v3)42πv(v2)(v4)53

Función de distribución

La función de distribución puede ser escrita en términos de I, la función beta incompleta.

Para x>0

FX(x)=xf(u)du=112Ix(t)(v2,12)

donde

x(t)=vt2+v

Una fórmula alternativa, válida para x2<v es

xf(u)du=12+xΓ(v+12)πvΓ(v2)2F1(12,v+12;32;x2v)

donde 2F1 es un caso particular de la función hipergeométrica.

Casos particulares

Ciertos valores de v dan una forma especial a la función de densidad y de distribución.

  • v=1
Función de densidad:
fX(x)=1π(1+x2)
Función de distribución:
FX(x)=12+1πarctan(x)
Véase Distribución de Cauchy.
  • v=2
Función de densidad:
fX(x)=122(1+x22)32
Función de distribución:
FX(x)=12+x221+x22
  • v=3
Función de densidad:
fX(x)=2π3(1+x23)2
Función de distribución:
FX(x)=12+1π[x3(1+x23)+arctan(x3)]
  • v=
Función de densidad:
fX(x)=12πex22
Véase Distribución normal.
Función de distribución:
FX(x)=12[1+erf(x2)]
Véase Función error.

Propiedades

Si X es una variable aleatoria tal que Xtv entonces X satisface algunas propiedades.

Media

La media de X para valores v>1 es

E[X]=0

Varianza

La varianza de X para valores v>2 es

Var(X)=vv2

Curtosis

La curtosis de X para valores v>4 es

6v4

Caracterización

La distribución t de Student con v grados de libertad puede definirse como la distribución de la variable aleatoria T definida por:

T:=ZXvtv

donde

Para una constante μ no nula, el cociente

(Z+μ)vX

es una variable aleatoria que sigue la distribución no central t de Student con parámetro de no-centralidad μ.

Intervalos de confianza para muestras de la distribución normal

Intervalo para la media cuando σ² es desconocida

Sean X1,,Xn una muestra aleatoria proveniente de una población con distribución N(μ,σ2) donde μ y σ son desconocidos.

Se tiene que

Xμσ/nN(0,1)

y

(n1)S2σ2χn12

son independientes entonces el cociente

Xμσ/n(n1)S2σ2n1tn1

esto es

XμS/ntn1

Sea tn1,1α/2 tal que

P[Ytn1,1α/2]=1α2

siendo Ytn1 entonces

P[tn1,1α/2XμS/ntn1,1α/2]=1αP[tn1,1α/2SnXμtn1,1α/2Sn]=1αP[Xtn1,1α/2SnμX+tn1,1α/2Sn]=1αP[Xtn1,1α/2SnμX+tn1,1α/2Sn]=1α

por lo tanto un intervalo de (1α)100% de confianza para μ cuando σ2 es desconocida es

(Xtn1,1α/2Sn,X+tn1,1α/2Sn)

Distribución t de Student generalizada

En términos del parámetro de escala σ̂

La distribución t de Student puede generalizarse a 3 parámetros, introduciendo un parámero locacional μ^ y un parámetro de escala σ^ mediante la relación

X=μ^+σ^T

o

T=Xμ^σ^

esto significa que xμ^σ^ tiene la distribución clásica t de Student con v grados de libertad.

La resultante distribución t de Student no estandarizada tiene por función de densidad:[14]

p(x|ν,μ^,σ^)=Γ(ν+12)Γ(ν2)πνσ^(1+1ν(xμ^σ^)2)ν+12

donde σ^ no corresponde a la desviación estándar, esto es, no es la desviación estándar de la distribución escalada t, simplemente es parámetro de escala de la distribución.

La distribución puede ser escrita en términos de σ^2, el cuadrado del parámetro de escala:

p(x|ν,μ^,σ^2)=Γ(ν+12)Γ(ν2)πνσ^2(1+1ν(xμ^)2σ^2)ν+12

Otras propiedades de esta versión de la distribución son:[14]

E[X]=μ^para ν>1,Var(X)=σ^2νν2para ν>2,Moda(X)=μ^.

En términos del parámetro inverso de escala λ

Una parametrización alterna está en términos del parámetro inverso de escala λ definido mediante la relación λ=1σ^2. La función de densidad está dada por:[14]

p(x|ν,μ^,λ)=Γ(ν+12)Γ(ν2)(λπv)12(1+λ(xμ^)2v)ν+12

Otras propiedades de esta versión de la distribución son:[14]

E[X]=μ^para ν>1,Var(X)=1λνν2para ν>2,Moda(X)=μ^.

Distribuciones relacionadas

  • Si Xtv entonces X2F1,v donde F1,v denota la distribución F con 1 y v grados de libertad.

Véase también

Referencias

Plantilla:Listaref

Enlaces externos

Plantilla:Control de autoridades