Criterio de Cramér-von Mises

De testwiki
Ir a la navegación Ir a la búsqueda

En estadística el criterio de Cramér-von Mises se emplea para juzgar la bondad de una función de distribución acumulada F* comparada con una función de distribución empírica Fn, o para comparar dos distribuciones empíricas. También se utiliza como parte de otros algoritmos, tal como la estimación de la distancia mínima. Se define como:

ω2=[Fn(x)F*(x)]2dF*(x)

Aplicándolo a una única muestra, F* es la distribución teórica y Fn es la empírica. Alternativamente las dos distribuciones pueden ser estimadas empíricamente; esto se conoce como un caso de dos muestras.

El criterio lleva los apellidos de Harald Cramér y Richard Edler von Mises, quienes fueron los primeros en exponerlo entre los años 1928-1930. La generalización de las dos muestras es obra de Theodore Wilbur Anderson.[1]

El criterio es una alternativa al test de Kolmogorov-Smirnov.

Test de Cramér-von Mises (una muestra)

Sean x1,x2,,xn los valores observados, en orden creciente. Entonces el estadístico es[1]Plantilla:Rp[2]

T=nω2=112n+i=1n[2i12nF(xi)]2.

Si este valor es mayor que el valor tabulado, se puede rechazar la hipótesis de que los datos provienen de la distribución F

Test de Watson

Una versión modificada del criterio es el test de Watson,[3] el cual usa el estadístico U2, donde[2]

U2=Tn(F¯12)2,

donde

F¯=1nF(xi).

Test de Cramér–von Mises test (dos muestras)

Sean x1,x2,,xN y y1,y2,,yM los valores observados en la primera y segunda muestra respectivamente, en orden creciente. Sean r1,r2,,rN los rangos de x en la muestra combinada, y sean s1,s2,,sM los rangos de y en la muestra combinada. Anderson[1]Plantilla:Rp muestra que

T=Nω2=UNM(N+M)4MN16(M+N)

donde U se define como

U=Ni=1N(rii)2+Mj=1M(sjj)2

Si el valor de T es mayor que los valores tabulados,[1]Plantilla:Rp se puede rechazar la hipótesis de que las dos muestras provienen de la misma distribución. Esto implica que no hay duplicados en x, y, y en las secuencias r. Por tanto xi es única, y su rango es i en x1,...xN. Si hay duplicados, y xi en xj son valores idénticos, donde se puede utilizar el enfoque del medio rango[4] método: asignar a cada duplicado un rango de (i+j)/2. En las ecuaciones precedentes, en las expresiones (rii)2 y (sjj)2, los duplicados pueden alterar las cuatro variables ri, i, sj, y j.

Referencias

Plantilla:Listaref

Bibliografía

  • Plantilla:Cita publicación
  • Plantilla:Cita libro
  • Pearson, E.S., Hartley, H.O. (1972) Biometrika Tables for Statisticians, Volume 2, CUP. ISBN 0-521-06937-8 (page 118 and Table 54)
  • Ruymgaart, F. H., (1980) "A unified approach to the asymptotic distribution theory of certain midrank statistics". In: Statistique non Parametrique Asymptotique, 1±18, J. P. Raoult (Ed.), Lecture Notes on Mathematics, No. 821, Springer, Berlín.
  • Watson, G.S. (1961) "Goodness-Of-Fit Tests on a Circle", Biometrika, 48 (1/2), 109-114

Lecturas

Enlaces externos

Plantilla:Control de autoridades

  1. 1,0 1,1 1,2 1,3 Anderson (1962)
  2. 2,0 2,1 Pearson & Hartley (1972) p 118
  3. Watson (1961)
  4. Ruymgaart (1980)