수학/확률과 통계

[확률과 통계] Normal Distribution (정규 분포)

바보1 2022. 5. 25. 20:35

1. Normal Distribution이란?

 

 

정규 분포란 좌우가 대칭인 분포를 말합니다.

이때 평균이 \(\mu\)이고, 분산이 \(\sigma^2\)인 정규 분포의 pdf는 아래와 같습니다.

\(f(x) = \frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}, for -\infty \leq x \leq \infty\)이고,

이때 X~N(\(\mu, \sigma^2\))라고 합니다.

 

만약 분산이 커지면 정규 분포는 완만하고 낮은 곡선을 가지게 됩니다. (옆으로 넓게 퍼진 형태)


2. Standard Normal Distribution

 

 

Standard Normal Distribution이란 평균이 0이고 분산이 1인 정규 분포를 말합니다.

X~N(\(\mu, \sigma^2\))인 정규 분포를 정규화한 정규 분포를 Y라고 합시다.

따라서 \(Y = \frac{X-\mu}{\sigma} = \frac{1}{\sigma}X + (-\frac{\mu}{\sigma})\) 입니다.

 

따라서 E(Y) = 0이 되고, V(Y) = 1이 됩니다.

위의 식에서 보시면 아시겠지만 일반적인 normal distribution으로는 확률 값을 구하기 어렵습니다. pdf가 너무 더럽기 때문이죠...

따라서 우리는 normal distribution을 standard normal distribution으로 변환(정규화)해서 확률을 계산합니다.

즉 \(Z = \frac{X-\mu}{\sigma}\)으로 정규화한 다음에 확률 값을 계산합니다.

 

따라서 Standard Normal Distribution의 pdf는 \(\phi(x) = \frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}\)이 됩니다.

그리고 표준 정규 분포의 cdf는 \(\Phi(x) = \int_{-\infty}^{x}\phi(y)dy \)이 됩니다.

 

참고로 표준 정규 분포에서 \(\Phi(0) = 0.5\) 입니다. 왜냐하면 pdf가 symmetric이기 때문입니다.

또한, 이런 성질도 가지고 있습니다.

\(1-\Phi(x) = P(Z \geq x) = P(Z \leq -x) = \Phi(-x)\)

\(\Phi(x) + \Phi(-x)= 1\)

 

이때 80th percentile을 찾는 법도 간단합니다.

\(\Phi(x) = 0.8\) 을 만족하는 x 값을 확률 값 테이블에서 찾으면 됩니다.

 

만약에 P(|Z| < x) = 0.7이라고 한다면, \(\Phi(-x) = 0.15\) 인 값을 찾으면 됩니다.

 

 

다음 글부터는 좀 더 표준 정규 분포에 대한 설명을 하도록 하겠습니다.

감사합니다.

 

 

지적 환영합니다.