Distribución t no central
Plantilla:Ficha de distribución de probabilidad
En Teoría de la probabilidad y Estadística, la distribución t no central generaliza la distribución t de Student mediante un parámetro de no centralidad. Así como en un contraste de hipótesis de igualdad de medias en una población normal, la distribución t de Student describe el estadístico de contraste cuando la hipótesis nula es cierta (igualdad de medias), la distribución t no central lo hace cuando la hipótesis nula es falsa; en consecuencia, es especialmente importante en el cálculo de la potencia estadística de un contraste. También se utiliza en la modelización robusta de datos.
Definición
Sea una variable aleatoria normal estándar y una variable aleatoria χ² con grados de libertad que es independiente de . Se dice[1] que la variable aleatoria
tiene una distribución t no central con grados de libertad y parámetro de no centralidad ; se escribe . Cuando se obtiene una distribución de Student ordinaria . Debe tenerse en cuenta que el parámetro de no centralidad puede ser negativo.
Comentario sobre los grados de libertad no enteros. El caso habitual de esta distribución es cuando el número de grados de libertad es un número natural, pero tanto desde el punto de vista de las aplicaciones como de la teoría, es conveniente que esta distribución pueda tener cualquier número estrictamente positivo de grados de libertad, . Esto es correcto gracias a que una distribución χ² cuadrado está bien definida para .
Función de densidad
La función de densidad de la distribución t no central no tiene una expresión sencilla y veremos diversas formulaciones que aparecen en la literatura. Sea . Expresión integral [2] Es interesante observar que cuando es un número natural, esta fórmula puede escribirse en términos de la función [3] donde Sobre la función consultar, por ejemplo, Jeffreys and Jeffreys. [4] Expresión en serie. [5]
Expresión mediante funciones especiales.
Utilizando la función cilíndrica parabólica [6](ver la versión digital [7]),
tenemos que [8] Mediante la función hipergeométrica confluente o función de Kummer , también denotada por ,[9] donde
Expresión en términos de la función de distribución El software estadístico R y otros programas estadísticos utilizan la siguiente expresión para calcular la función de densidad [1]:
donde es la función de distribución de la distribución no central con grados de libertad y parámetro de no centralidad (véase el siguiente apartado).
Función de distribución
La función de distribución de la distribución t no central con grados de libertad y parámetro de no centralidad se puede expresar como [10][11] donde
y es la función de distribución de la distribución normal estándar. Nótese que sólo depende de y por tanto en (6), para es indistinto poner o .
Momentos
El momento de orden de una distribución no central es [12]
- donde designa la derivada de orden k -ésimo de la función .
En particular, la media y la varianza son:
Aplicación al cálculo de la potencia del contraste t de Student
Véase Johnson and Welch.[13] Sea una muestra de una población normal , es decir, las variables aleatorias son independientes y todas tienen distribución . Fijado un número . Queremos contrastar En el contraste de Student, el estadístico de contraste es donde és la media muestral y es la varianza muestral (modificada): Bajo la hipótesis nula , (véase la distribución de Student). Fijado un nivel de significación (habitualmente o ), para determinar la región crítica calculamos el valor tal quedonde En este contexto, rechazamos si . Dado un valor (por tanto, de la hipótesis alternativa), podemos calcular la potencia del test, es decir, la probabilidad de rechazar la hipótesis nula cuando es falsa, en este punto, de la siguiente manera: escribimosEn la expresión de la derecha,
- Si suponemos , entonces .
- Tenemos que y por tanto es una variable aleatoria con una distribución (véase la distribución χ²) dividida por sus grados de libertad.
- Las variables aleatorias de los puntos 1 y 2 son independientes (véase la distribución χ²) .
En consecuencia, si , tenemos que . Por tanto, la potencia del test en el punto será
Uso en intervalos de tolerancia
Los intervalos de tolerancia normales unilaterales tienen una solución exacta en términos de la media muestral y la varianza muestral basada en la distribución t no central.[14] Esto permite calcular un intervalo estadístico dentro del cual, con cierto nivel de confianza, se encuentra una proporción especificada de la población.
Referencias
Plantilla:Control de autoridades
- ↑ Plantilla:Cita libro
- ↑ Plantilla:Ref-libro
- ↑ Plantilla:Cita publicación
- ↑ Plantilla:Cita libro
- ↑ Plantilla:Cita publicación
- ↑ Plantilla:Cita libro
- ↑ Plantilla:Cita web
- ↑ Plantilla:Cita publicación
- ↑ Plantilla:Cita web
- ↑ Plantilla:Cita publicación
- ↑ Plantilla:Cita publicación
- ↑ Plantilla:Cite journal
- ↑ Plantilla:Cita publicación
- ↑ Plantilla:Cita publicación