Problema del coleccionista de cupones

De testwiki
Revisión del 16:54 7 ene 2025 de imported>Aosbot (Añadiendo Control de autoridades)
(difs.) ← Revisión anterior | Revisión actual (difs.) | Revisión siguiente → (difs.)
Ir a la navegación Ir a la búsqueda
Gráfica del número de cupones n contra el número esperado de pruebas (es decir, el tiempo) necesario para tener una colección completa de ellos, E (T ).

En probabilidad y estadística, el problema del coleccionista de cupones describe los concursos del tipo «colecciona todos los cupones y gana». Se trata de la siguiente pregunta:

Plantilla:Cita

El análisis matemático del problema revela que el valor esperado de pruebas necesarias crece a razón de Θ(nlog(n)).[Nota 1] Por ejemplo, cuando n=50 la respuesta es aproximadamente 225[Nota 2] pruebas en promedio para coleccionar todos los 50 cupones.


Solución

Cálculo del valor esperado

Sea el tiempo T el número de pruebas necesarias para coleccionar todos los n cupones, y sea ti el tiempo para coleccionar el i-ésimo cupón después de que se tienen i1 cupones en la colección. Entonces T=t1++tn. Se puede pensar en T y ti como variables aleatorias. Se debe observar que la probabilidad de añadir un cupón Plantilla:Enf es pi=n(i1)n=ni+1n. Por lo tanto, ti tiene una distribución geométrica con valor esperado 1pi=nni+1. Por la linealidad de la esperanza se tiene:

E(T)=E(t1+t2++tn)=E(t1)+E(t2)++E(tn)=1p1+1p2++1pn=nn+nn1++n1=n(11+12++1n)=nHn.

Aquí, Hn es el n-ésimo número armónico. Usando la asíntota de los números armónicos, se obtiene:

E(T)=nHn=nlogn+γn+12+O(1/n),

donde γ0.5772156649 es la Constante de Euler–Mascheroni.

Aquí es posible usar la desigualdad de Márkov para establecer límites a la probabilidad deseada:

P(TcnHn)1c.

Se puede ver que la anterior puede ser modificada levemente para el case en el que ya se tienen algunos de los cupones. sea k el número de cupones ya coleccionados, entonces:

E(Tk)=E(tk+1+tk+2++tn)=n(11+12++1nk)=nHnk

Se aprecia que cuando k=0 se obtiene el resultado original.

Cálculo de la varianza

Usando la independencia de las variables aleatorias ti se obtienen:

Var(T)=Var(t1++tn)=Var(t1)+Var(t2)++Var(tn)=1p1p12+1p2p22++1pnpn2<(n2n2+n2(n1)2++n212)=n2(112+122++1n2)<π26n2

ya que π26=112+122++1n2+ (véase problema de Basilea).

Ahora es posible usar la desigualdad de Chebyshev para establecer la cota:

P(|TnHn|cn)π26c2.


Estimaciones de cola

Es posible establecer una cota superior diferente a partir de la siguiente observación. SeaZir el evento en el que el i-ésimo cupón no fue seleccionado en las primeras r pruebas. Entonces:

P[Zir](11n)rer/n

Por lo tanto, como r=βnlogn, se tiene P[Zir]e(βnlogn)/n=nβ.

P[T>βnlogn]=P[iZiβnlogn]nP[Z1βnlogn]nβ+1

Extensiones y generalizaciones

P(T<nlogn+cn)eec, as n.
  • Donald J. Newman y Lawrence Shepp mostraron una generalización del problema cuando se necesitan coleccionar m copias de cada cupón. Sea Tm la primera vez que se coleccionan m copias de cada cupón. Demostraron que la expectativa en este caso satisface:
E(Tm)=nlogn+(m1)nloglogn+O(n), as n.
En este caso, m es un valor fijo. Cuando m=1 se obtiene la fórmula anterior para el valor esperado.
  • Una generalización común, también demostrada por Erdős y Rényi:
P(Tm<nlogn+(m1)nloglogn+cn)eec/(m1)!, as n.
E(Tm)=0(1i=1m(1epit))dt.
Esto es igual a:
E(Tm)=q=0m1(1)m1q|J|=q11PJ
donde m denota el número de cupones que deben ser coleccionados, y PJ la probabilidad de tener cualquier cupón en el conjunto J de cupones.

Véase también

Notas

Plantilla:Listaref

Referencias

Plantilla:Listaref

Plantilla:Refcomienza

Plantilla:Reftermina

Enlaces externos

Plantilla:Traducido ref

Plantilla:Control de autoridades


Error en la cita: Existen etiquetas <ref> para un grupo llamado «Nota», pero no se encontró la etiqueta <references group="Nota"/> correspondiente.