수학/확률과 통계

[확률과 통계] The Lognormal Distribution, The Chi-Square Distribution (로그 정규 분포, 카이 제곱 분포)

바보1 2022. 5. 26. 02:07

1. The Lognormal Distribution

 

Lognormal에서는 XN(μ,σ2)를 따를 때, Y = ln(X) ~ N(μ,σ2)로 정의합니다.

그냥 기존의 normal distribution의 pdf에서 x를 ln(x)로 바꾼 게 끝입니다..

그게 아니라 Random Variable X를 ln(X)로 표현한 형태입니다.

그리고 ln(X)로 바꾼 것을 Y라고 칭합니다.

 

pdf는 f(x)=12πσx(ln(x)μ)22σ2입니다.

정규 분포의 pdf는 f(x)=12πσ(xμ)22σ2입니다.

분모에 x가 곱해지고, exp의 x가 ln(x)가 됩니다.

 

cdf도 비슷하지만 중요합니다.

 

cdf의 유도 공식은 P(Xx)=P(ln(X)ln(x))=P(Yμσln(x)μσ)=ϕ(ln(x)μσ)입니다.

 

F(x)=Φ(ln(x)μσ)입니다.

cdf는 normal 분포와 공유가 가능합니다. x만 ln(x)로 바뀐 형태로 사용할 수 있습니다.

 

아무튼 E(X) = eμ+σ22,

Var(X) = e2μ+σ2(eσ21)입니다.

 

Lognormal Distribution은 오른쪽으로 길게 늘어진 형태입니다.

 

이때 median 값은 eμ이고, 평균값보다 작습니다.

참고로 median 값을 구하는 과정은 Φ(ln(x)μσ)=0.5ln(x)μσ=za=0ln(x)μ=0x=eμ입니다.

사실 갑자기 혼란스러워서 이해하기 힘들었는데, Φ()라는 것은 standard normal distribution을 기준으로 설명하는 것이기 때문에 za=0인 것은 당연합니다.

 

1 - a 번째 quantile인 x = eμ+σza입니다. 이를 통해서 median 값을 쉽게 도출할 수 있습니다.

 

 


2. The Chi-Square Distribution

 

 

X~N(0, 1)이 있다고 했을 때, 카이 제곱 분포는 Y = X2입니다.

 

이때 chi-square 분포는 n degree를 가지고 있는데, n이 뜻하는 바는 더하는 정규 분포의 개수입니다.

즉 n degree를 가지고 있는 Y는 Y = X12++Xn2이 됩니다.

 

이때 degree는 통상적으로 ν(누)라고 합니다.

 

만약 X~χν2이라고 하고, X1χν12, X2χν22라고 합시다.

이때 Y = X1+X2이면, 이는 곧 χν1+ν22와 같습니다.

왜냐면 X는 이미 제곱되어 있는 형태라서 그대로 더하면 되기 때문입니다.

 

카이 제곱 분포는 감마 분포의 특별한 형태입니다.

Gamma Distribution에서 λ=1/2,k=ν/2라면 기댓값은 ν이고, 분포는 2ν가 됩니다.

 

또한 그때의 pdf는 f(x)=12ν/2Γ(ν/2)xν/21ex/2이 됩니다.

 

 

감사합니다.

 

 

지적 환영합니다.