1. The Lognormal Distribution
Lognormal에서는 \(X \sim N(\mu, \sigma^2)\)를 따를 때, Y = ln(X) ~ \(N(\mu, \sigma^2)\)로 정의합니다.
그냥 기존의 normal distribution의 pdf에서 x를 ln(x)로 바꾼 게 끝입니다..
그게 아니라 Random Variable X를 ln(X)로 표현한 형태입니다.
그리고 ln(X)로 바꾼 것을 Y라고 칭합니다.
pdf는 \(f(x) = \frac{1}{\sqrt{2\pi}\sigma x}^{-\frac{(ln(x)-\mu)^2}{2\sigma^2}}\)입니다.
정규 분포의 pdf는 \(f(x) = \frac{1}{\sqrt{2\pi}\sigma}^{-\frac{(x-\mu)^2}{2\sigma^2}}\)입니다.
분모에 x가 곱해지고, exp의 x가 ln(x)가 됩니다.
cdf도 비슷하지만 중요합니다.
cdf의 유도 공식은 \(P(X \leq x)= P(ln(X) \leq ln(x)) = P(\frac{Y - \mu}{\sigma} \leq \frac{ln(x) - \mu}{\sigma}) = \phi(\frac{ln(x) - \mu}{\sigma})\)입니다.
\(F(x) = \Phi(\frac{ln(x) - \mu}{\sigma})\)입니다.
cdf는 normal 분포와 공유가 가능합니다. x만 ln(x)로 바뀐 형태로 사용할 수 있습니다.
아무튼 E(X) = \(e^{\mu + \frac{\sigma^2}{2}}\),
Var(X) = \(e^{2\mu + \sigma^2}(e^{\sigma^2} - 1)\)입니다.
Lognormal Distribution은 오른쪽으로 길게 늘어진 형태입니다.
이때 median 값은 \(e^\mu\)이고, 평균값보다 작습니다.
참고로 median 값을 구하는 과정은 \(\Phi(\frac{ln(x) - \mu}{\sigma}) = 0.5 \Rightarrow \frac{ln(x) - \mu}{\sigma} = z_a = 0 \Rightarrow ln(x) - \mu = 0 \Rightarrow x = e^\mu\)입니다.
사실 갑자기 혼란스러워서 이해하기 힘들었는데, \(\Phi()\)라는 것은 standard normal distribution을 기준으로 설명하는 것이기 때문에 \(z_a = 0\)인 것은 당연합니다.
1 - a 번째 quantile인 x = \(e^{\mu + \sigma z_a}\)입니다. 이를 통해서 median 값을 쉽게 도출할 수 있습니다.
2. The Chi-Square Distribution
X~N(0, 1)이 있다고 했을 때, 카이 제곱 분포는 Y = \(X^2\)입니다.
이때 chi-square 분포는 n degree를 가지고 있는데, n이 뜻하는 바는 더하는 정규 분포의 개수입니다.
즉 n degree를 가지고 있는 Y는 Y = \(X_1^2 + \dots + X_n^2\)이 됩니다.
이때 degree는 통상적으로 \(\nu\)(누)라고 합니다.
만약 X~\(\chi_\nu^2\)이라고 하고, \(X_1 \sim \chi_{\nu_1}^2 \), \(X_2 \sim \chi_{\nu_2}^2 \)라고 합시다.
이때 Y = \(X_1 + X_2\)이면, 이는 곧 \(\chi_{\nu_1 + \nu_2}^2\)와 같습니다.
왜냐면 X는 이미 제곱되어 있는 형태라서 그대로 더하면 되기 때문입니다.
카이 제곱 분포는 감마 분포의 특별한 형태입니다.
Gamma Distribution에서 \(\lambda = 1/2, k = \nu / 2\)라면 기댓값은 \(\nu\)이고, 분포는 \(2\nu\)가 됩니다.
또한 그때의 pdf는 \(f(x) = \frac{1}{2^{\nu / 2}\Gamma(\nu/2)}x^{\nu/2-1}e^{-x/2}\)이 됩니다.
감사합니다.
지적 환영합니다.