Diferencia entre revisiones de «Distribución log-normal»

De testwiki
Ir a la navegación Ir a la búsqueda
la cdf actual está incumpleta ya que asume mu=sigma=1
 
(Sin diferencias)

Revisión actual - 18:30 22 nov 2023

Plantilla:Ficha de distribución de probabilidad

En probabilidad y estadística, la distribución normal logarítmica es una distribución de probabilidad continua de una variable aleatoria cuyo logaritmo está normalmente distribuido. Es decir, si X es una variable aleatoria con una distribución normal, entonces exp(X) tiene una distribución log-normal, es decir eXLognormal(μx,σx2).

Log-normal también se escribe log normal o lognormal o distribución de Tinaut.

Una variable puede ser modelada como log-normal si puede ser considerada como un producto multiplicativo de muchos pequeños factores independientes. Un ejemplo típico es un retorno a largo plazo de una inversión: puede considerarse como un producto de muchos retornos diarios.

Definición

Función de Densidad

Una variable aleatoria positiva X tiene una distribución lognormal con parámetros μ y σ y escribimos XLognormal(μ,σ2), si el logaritmo natural de X sigue una distribución normal con media μ y varianza σ2, esto es

ln(X)N(μ,σ2)

Sean Φ y ϕ las funciones de distribución acumulada y de densidad de una normal estándar N(0,1), entonces la función de densidad de probabilidad de la distribución log-normal está dada por:

fX(x)=ddxP[Xx]=ddxP[ln(X)ln(x)]=ddxΦ(lnxμσ)=ϕ(lnxμσ)ddx(lnxμσ)=ϕ(lnxμσ)1σx=1σx2πexp((lnxμ)22σ2)

Función de Distribución

La función de distribución acumulada es

FX(x)=Φ(lnxμσ)

donde Φ es la función de distribución acumulada de una normal estándar N(0,1).

La expresión anterior también puede ser escrita como

12[1+erf(lnxμσ2)]=12erfc(lnxμσ2)

Log-normal Multivariada

Si𝑿N(μ,Σ) es una distribución normal multivariada entonces 𝒀=exp(𝑿) tiene una distribución lognormal multivariante con media

E[𝒀]i=eμi+12Σii

y matriz de covarianza

Var(𝒀)ij=eμi+μj12(Σii+Σjj)(eΣij1)

Propiedades

Si XLognormal(μ,σ2) entonces la variable aleatoria X cumple algunas propiedades.

La media de X es

E[X]=eμ+σ22

La varianza de X es

Var(X)=(eσ21)e2μ+σ2.

Relación con media y la desviación estándar geométrica

La distribución log-normal, la media geométrica, y la desviación estándar geométrica están relacionadas. En este caso, la media geométrica es igual a exp(μ) y la desviación estándar geométrica es igual a exp(σ).

Si una muestra de datos determina que proviene de una población distribuida siguiendo una distribución log-normal, la media geométrica de la desviación estándar geométrica puede utilizarse para estimar los intervalos de confianza tal como la media aritmética y la desviación estándar se usan para estimar los intervalos de confianza para un dato distribuido normalmente.

Límite de intervalo de confianza log geométrica
3σ límite inferior μ3σ μgeo/σgeo3
2σ límite inferior μ2σ μgeo/σgeo2
1σ límite inferior μσ μgeo/σgeo
1σ límite superior μ+σ μgeoσgeo
2σ límite superior μ+2σ μgeoσgeo2
3σ límite superior μ+3σ μgeoσgeo3

Donde la media geométrica μgeo=exp(μ) y la desviación estándar geométrica σgeo=exp(σ)

Momentos

Los primeros momentos son:

μ1=eμ+σ2/2
μ2=e2μ+4σ2/2
μ3=e3μ+9σ2/2
μ4=e4μ+16σ2/2

o de forma general:

μk=ekμ+k2σ2/2.

Inferencia Estadística

Estimación de parámetros

Para determinar los estimadores por máxima verosimilitud de la distribución lognormal con parámetros μ y σ2, podemos utilizar el mismo método que se utilizó para estimar los parámetros de una distribución normal. Notemos que

L(μ,σ)=i=1n1xiφμ,σ(lnxi)

donde φ denota la función de densidad de la distribución normal N(μ,σ2) entonces la función logarítmica de verosimilitud es

(x1,x2,...,xn;μ,σ)=ilnxi+N(lnx1,lnx2,...,lnxn;μ,σ)

Dado que el primer término es constante respecto a μ y σ, ambas funciones logarítmicas de verosimilitud, y N, obtienen su máximo con el mismo μ y σ, por lo tanto, utilizando los estimadores por máxima verosimilitud son idénticos a los de la distribución normal para observaciones lnx1,lnx2,,lnxn

μ^=klnxkn,σ2^=k(lnxkμ^)2n.

Para una

n

finita, estos estimadores son in sesgados.

Distribución log-normal ajustada a datos de lluvias máximas diarias por año.[1]

Aplicación

  • En la hidrología, se utiliza la distribución log-normal para analizar variables aleatorias como valores máximos de la precipitación y la descarga de ríos,[2] y además para describir épocas de sequía.[3]


La imagen azul ilustra un ejemplo del ajuste de la distribución log-normal a lluvias máximas diarias ordenadas, mostrando también la franja de 90% de confianza, basada en la distribución binomial. Las observaciones presentan los marcadores de posición, como parte del análisis de frecuencia acumulada.

Distribución relacionada

  • Si X N(μ,σ2) es una distribución normal entonces eXLognormal(μ,σ2).
  • Si XLognormal(μ,σ2) entonces ln(X)N(μ,σ2).
  • Si XmLognormal(μ,σm2), m=1...n son variables independentes log-normalmente distribuidas con el mismo parámetro μ y permitiendo que varíe σ, y Y=m=1NXm, entonces Y es una variable distribuida log-normalmente como: YLognormal(μ,mσm2).
  • Si XLognormal(μ,σ2) entonces XαLognormal(αμ,α2σ2) para α0.

Véase también

Software

Se puede usar software o programa de computadora para el ajuste de una distribución de probabilidad, incluyendo la lognormal, a una serie de datos:

Referencias

Plantilla:Listaref


Plantilla:Control de autoridades

  1. CumFreq, software for cumulative frequency analysis and probability distribution fitting [2]
  2. Plantilla:Cite book
  3. Plantilla:Cite journal