Distribución de Pareto

De testwiki
Revisión del 13:02 4 mar 2025 de imported>Uruk (Estimación de parámetros)
(difs.) ← Revisión anterior | Revisión actual (difs.) | Revisión siguiente → (difs.)
Ir a la navegación Ir a la búsqueda

Plantilla:Otros usos

Plantilla:Ficha de distribución de probabilidad

En teoría de la probabilidad y en estadística, la distribución Pareto es una distribución de probabilidad continua con dos parámetros, que tiene aplicación en disciplinas como la sociología, la geofísica y la economía.[1] Fue formulada por el ingeniero civil, economista y sociólogo Vilfredo Pareto, aunque en ciertas áreas de estudio se hace referencia a la ley de Bradford. Cabe señalar que el equivalente discreto de la distribución Pareto es la distribución zeta (la ley de Zipf).

Cuando la distribución de Pareto es usada en un modelo sobre la distribución de riqueza, el parámetro α es conocido como índice de Pareto.

Definición

Notación

Si X es una variable aleatoria continua con distribución Pareto con parámetros α>0 y xm>0 entonces escribimos XPareto(α,xm).

Función de densidad

La función de densidad de una variable aleatoria XPareto(α,xm) es

fX(x)=αxmαxα+1

para xmx.

Probabilidad acumulada

La función de distribución de una variable aleatoria XPareto(α,xm) es, para xmx,

FX(x)=1(xmx)α

Propiedades

Si XPareto(α,xm) entonces la variable aleatoria X satisface algunas propiedades.

Media

La media de la variable aleatoria X es

E[X]=αxmα1

con α>1.

Varianza

La varianza de la variable aleatoria X

Var(X)=αxm2(α1)2(α2)

para α>2.

Momentos

El n-ésimo momento sólo está definido para n<α y en tal caso es

E[Xn]=αxmnαn

Función generadora de momentos

La función generadora de momentos es

MX(t)=α(xmt)αΓ(α,xmt)

y está definida para valores t<0.

Caso degenerado

La función de la delta de Dirac es un caso límite de la densidad de Pareto:

limαf(x;α,xm)=δ(xxm).

Distribución simétrica

Puede definirse una Distribución de Pareto Simétrica según:[2]

f(x;α,xm)={(αxmα/2)|x|α1si |x|>xm0resto.

Distribución Generalizada de Pareto

Plantilla:Ficha de distribución de probabilidad La familia de distribuciones generalizadas de Pareto (GPD) tienen tres parámetros μ,σ y ξ.

La función de probabilidad acumulada es

F(ξ,μ,σ)(x)={1(1+ξ(xμ)σ)1/ξsi ξ0,1exp(xμσ)si ξ=0.

Para xμ, con ξ0, y xμσ/ξ con ξ<0, donde μ es el parámetro localización, σ>0 es el parámetro escala y ξ es el parámetro forma. Nótese que algunas referencias toman el parámetro forma como κ=ξ.

La función de densidad de probabilidad es:

f(ξ,μ,σ)(x)=1σ(1+ξ(xμ)σ)(1ξ1).

o

f(ξ,μ,σ)(x)=σ1ξ(σ+ξ(xμ))1ξ+1.

de nuevo, para xμ, y xμσ/ξ si ξ<0

Inferencia estadística

Estimación de parámetros

La función de verosimilitud para los parámetros de la distribución de Pareto α y xm, dada una muestra independiente x = (x1x2, ..., xn), es

L(α,xm)=i=1nαxmαxiα+1=αnxmnαi=1n1xiα+1.

Por lo tanto, la función de verosimilitud logarítmica es

(α,xm)=nlnα+nαlnxm(α+1)i=1nlnxi.

Se puede ver que (α,xm) es monotonamente ascendente con xm, es decir, cuanto mayor es el valor de xm, mayor es el valor de la función de verosimilitud. Por lo tanto, dado que xxm, se concluye que

x^m=minixi.

Para calcular el estimador de α, se calcula la derivada parcial correspondiente y se determina dónde es cero:

α=nα+nlnxmi=1nlnxi=0.

Por lo tanto el estimador de máxima verosimilitud para α ess:

α^=niln(xi/x^m).

El error estadístico esperado es:[3]

σ=α^n.

Malik (1970)[4] da la distribución conjunta exacta de (x^m,α^). En particular, x^m y α^ son independientes y x^m es Pareto con parámetro de escala xm y parámetro de forma , mientras que α^ posee una distribución gama inversa con parámetros de forma y escala n − 1 y , respectivamente.

Ocurrencia y aplicaciones

General

Aplicación de la distribución de probabilidad acumulada de Pareto a lluvias diarias máximas.[5]

Vilfredo Pareto utilizó originalmente esta distribución para describir la asignación de la riqueza entre los individuos, ya que parecía mostrar bastante bien la forma en que una mayor parte de la riqueza de cualquier sociedad es propiedad de un porcentaje menor de las personas de esa sociedad. También lo utilizó para describir la distribución de la renta.[6] Esta idea se expresa a veces de forma más sencilla como el principio de Pareto o la "regla del 80-20", que dice que el 20% de la población controla el 80% de la riqueza.[7] Sin embargo, la regla del 80-20 corresponde a un valor particular de α, y de hecho, los datos de Pareto sobre los impuestos británicos sobre la renta en su Cours d'économie politique indican que aproximadamente el 30% de la población tenía alrededor del 70% de los ingresos. La función de densidad de probabilidad (PDF) al principio de este artículo muestra que la "probabilidad" o fracción de la población que posee una pequeña cantidad de riqueza por persona es bastante alta, y luego disminuye constantemente a medida que aumenta la riqueza. (Sin embargo, la distribución de Pareto no es realista para la riqueza del extremo inferior. De hecho, el patrimonio neto puede ser incluso negativo). Esta distribución no se limita a describir la riqueza o la renta, sino muchas situaciones en las que se encuentra un equilibrio en la distribución de lo "pequeño" a lo "grande". Los siguientes ejemplos se consideran a veces como una distribución de Pareto aproximada:

Distribución acumulativa de Pareto (Lomax) ajustada a las precipitaciones máximas de un día utilizando CumFreq, véase también ajuste de distribución
  • Los valores de las reservas de petróleo en los yacimientos petrolíferos (unos pocos grandes yacimientos, muchos pequeños yacimientos)[8]
  • La distribución de la longitud en los trabajos asignados a los superordenadores (unos pocos grandes, muchos pequeños)[12]
  • La rentabilidad estandarizada de los precios de las acciones individuales[8]
  • Los tamaños de las partículas de arena[8]
  • El tamaño de los meteoritos
  • La gravedad de las grandes pérdidas por fallecimiento en el negocio de Seguros, para ciertas líneas de negocio como la responsabilidad civil general, el automóvil comercial y la compensación de los trabajadores.[13][14]
  • Cantidad de tiempo que un usuario en el servicio Steam pasará jugando a diferentes juegos. (Algunos juegos se juegan mucho, pero la mayoría no se juegan casi nunca) [1]
  • En hidrología la distribución de Pareto se aplica a eventos extremos como las precipitaciones máximas anuales de un día y las descargas de los ríos.[15] y además para describir épocas de sequía.[16][17] La imagen azul ilustra un ejemplo de ajuste de la distribución de Pareto a las precipitaciones máximas anuales de un día clasificadas mostrando también la banda de confianza del 90% basada en la distribución binomial. Los datos de las precipitaciones se representan mediante posición de trazado como parte del análisis de la frecuencia acumulada.
  • En la fiabilidad de la distribución de los servicios eléctricos (el 80% de los minutos de los clientes interrumpidos se producen en aproximadamente el 20% de los días de un año determinado).

Software

Se puede usar software y un programa de computadora para el ajuste de una distribución de probabilidad, incluyendo la de Pareto, a una serie de datos:

Bibliografía

  • Barry C. Arnold (1983). Pareto Distributions, International Co-operative Publishing House, Burtonsville, Maryland. ISBN 0-899974-012-1.
  • Christian Kleiber and Samuel Kotz (2003). Statistical Size Distributions in Economics and Actuarial Sciences, New York:Wiley. xi+332 pp. ISBN 0-471-15064-9.
  • Lorenz, M. O. (1905). "Methods of measuring the concentration of wealth". Publications of the American Statistical Association. 9: 209–219.

Referencias

Plantilla:Listaref

Véase también

Enlaces externos

Plantilla:Control de autoridades

  1. Plantilla:Cita publicación
  2. Plantilla:Cita web
  3. Plantilla:Cite journal
  4. Plantilla:Cite journal
  5. CumFreq software para adecuación de distribuciones de probabilidad [2]
  6. Pareto, Vilfredo, Cours d'Économie Politique: Nouvelle édition par G.-H. Bousquet et G. Busino, Librairie Droz, Ginebra, 1964, pp. 299-345. Libro original archivado
  7. Para una población de dos cuantiles, en la que aproximadamente el 18% de la población posee el 82% de la riqueza, el índice de Theil toma el valor 1.
  8. 8,0 8,1 8,2 8,3 8,4 Plantilla:Cite journal
  9. Plantilla:Cite journal
  10. Plantilla:Cite journal
  11. Plantilla:Cite journal
  12. {Cite journal|last1=Harchol-Balter|first1=Mor|author1-link=Mor Harchol-Balter|last2=Downey|first2=Allen|date=August 1997|title=Exploiting Process Lifetime Distributions for Dynamic Load Balancing|url=https://users Plantilla:Wayback. soe.ucsc.edu/~scott/courses/Fall11/221/Papers/Sync/harcholbalter-tocs97.pdf|journal=ACM Transactions on Computer Systems|volume=15|issue=3|pages=253-258|doi=10.1145/263326.263344|s2cid=52861447}
  13. Kleiber y Kotz (2003): p. 94.
  14. Plantilla:Cite journal
  15. Plantilla:Cite book
  16. Plantilla:Cite journal
  17. CumFreq, software para el análisis de frecuencias acumulativas y el ajuste de la distribución de probabilidad [3]