Estimador de Horvitz–Thompson

De testwiki
Ir a la navegación Ir a la búsqueda

En estadística, el estimador de Horvitz-Thompson, llamado así por Daniel G. Horvitz y Donovan J. Thompson,[1] es un método para estimar el total[2] y la media de una pseudopoblación en una muestra estratificada. La ponderación de probabilidad inversa se aplica para tener en cuenta las diferentes proporciones de observaciones dentro de los estratos de una población objetivo. El estimador de Horvitz-Thompson se aplica con frecuencia en análisis de encuestas y se puede utilizar para dar cuenta de los datos faltantes.

El método

Formalmente, deja Yi,i=1,2,,n ser una muestra independiente de n de N ≥ n estratos distintos con una media común μ. Supongamos además que πi es la probabilidad de inclusión de que un individuo muestreado al azar en una superpoblación pertenezca al i- ésimo estrato. La estimación de Horvitz-Thompson del total viene dada por:

Y^HT=i=1nπi1Yi,

y la estimación de la media viene dada por:

μ^HT=N1Y^HT=N1i=1nπi1Yi.

En un marco probabilístico bayesiano πi se considera la proporción de individuos de una población objetivo pertenecientes al i-ésimo estrato. Por lo tanto, πi1Yi podría pensarse como una estimación de la muestra completa de personas dentro del i-ésimo estrato. El estimador de Horvitz-Thompson también se puede expresar como el límite de una estimación de remuestreo bootstrap ponderada de la media. También puede verse como un caso especial de enfoques de imputación múltiple.[3]

Para diseños de los estudios post estratificados, la estimación de π y μ se realizan en distintos pasos. En tales casos, calcular la varianza de μ^HT no es sencillo. Se pueden aplicar técnicas de remuestreo como el bootstrap o el jackknife para obtener estimaciones consistentes de la varianza del estimador de Horvitz-Thompson.[4] El paquete "encuesta" para R realiza análisis para datos posestratificados utilizando el estimador de Horvitz-Thompson.[5]

Prueba de la estimación no sesgada de la media de Horvitz-Thompson

Se puede demostrar que el estimador de Horvitz-Thompson es insesgado al evaluar la expectativa del estimador de Horvitz-Thompson, 𝐄X¯nHT, como sigue:

𝐄X¯nHT=𝐄1Ni=1n𝐗IiπIi
=𝐄1Ni=1NXiπi1iDn
=b=1BP(Dn(b))[1Ni=1NXiπi1iDn(b)]
=1Ni=1NXiπib=1B1iDn(b)P(Dn(b))
=1Ni=1N(Xiπi)πi
=1Ni=1NXi
dondeDn={x1,x2,...,xn}

Referencias

Plantilla:Listaref

Enlaces externos

Plantilla:Control de autoridades

  1. Horvitz, D. G.; Thompson, D. J. (1952) "A generalization of sampling without replacement from a finite universe", Journal of the American Statistical Association, 47, 663–685, . Plantilla:JSTOR
  2. William G. Cochran (1977), Sampling Techniques, 3rd Edition, Wiley. Plantilla:ISBN
  3. Roderick J.A. Little, Donald B. Rubin (2002) Statistical Analysis With Missing Data, 2nd ed., Wiley. Plantilla:ISBN
  4. Plantilla:Cita publicación
  5. Plantilla:Obra citada