수학/확률과 통계

[확률과 통계] Standard Normal Distribution (표준 정규 분포), Standard Normal Distribution의 다양한 속성

바보1 2022. 5. 25. 21:47

1. Critical Point : z_a

 

\(z_a\)는 표준 정규 분포의 critical point라고 합니다. 

남은 면적을 a로 만드는 값을 \(z_a\)라고 합니다.

 

이때 \(z_a\)는 (1-a) * 100 percentile를 만드는 값이라고도 볼 수 있습니다. (이때 a < 0.5)

또한 \(\Phi(z_a) = 1 - a\)입니다.

마지막으로 가장 중요한 특징이 있는데, 이는 정규 분포의 대칭성을 활용한 특징입니다.

\(P(|Z| \leq z_{a/2}) = P(-z_{a/2} \leq Z \leq z_{a/2}) = \Phi(z_{a/2}) - \Phi(-z_{a/2}) = (1 - a/2) - a/2 = 1-a\)

위의 식은 같은 면적을 이분할해서 대칭으로 만들어서 해결한 특징입니다.

 


2. Normal Distribution의 정규화를 통한 확률 값 계산

 

 

만약 어떤 확률 분포 X가 N(\(\mu, \sigma^2\))를 따른다고 가정해봅시다.

이때 a와 b 사이의 값을 어떻게 찾을까요?

정규 분포에서 a와 b 사이의 값을 찾는 것은 너무나 구하기 힘듭니다.

따라서 우리는 이러한 분포를 Standard Normal Distribution으로 변환해서 손쉽게 계산할 수 있습니다.

 

\(P(a \leq X \leq b) = P(\frac{a-\mu}{\sigma} \leq \frac{X-\mu}{\sigma} \leq \frac{b-\mu}{\sigma}) = P(\frac{a-\mu}{\sigma} \leq Z \leq \frac{b-\mu}{\sigma}) = \Phi(\frac{b-\mu}{\sigma}) - \Phi(\frac{a-\mu}{\sigma})\)

이해가 되시나요?

이렇게 우리는 정규 분포를 표준 정규 분포로 변환하여 계산합니다.

 


3. General Normal Distribution

 

 

일반적으로 X~N(\(\mu, \sigma^2\))를 따릅니다.

이때 \(P(\mu-c\sigma \leq X \leq \mu+c\sigma) = P(-c \leq Z \leq c)\)라는 식이 탄생하게 됩니다.

 

즉, 앞의 식에서 c = 1이라면 -1 ~ 1까지의 범위 안에 있는 확률 값이므로 약 68%가 범위 안에 들어가게 됩니다.

마찬가지로 c = 2이라면 95%가 범위 안에 들어갑니다.

마지막으로 c = 3이라면 99.7%가 범위 안에 들어갑니다.

 

따라서 95%의 확률을 가지는 범위를 알고 싶다면, \(P(-2 \leq Z \leq 2)\)를 통해서 X를 변환하면 됩니다.

또는 그냥 "평균 - 2 * 표준 편차 ~ 평균 + 2 * 표준 편차"가 범위가 되겠네요.

 

추가적으로 Critical Point를 이용해서 범위를 풀 수도 있습니다.

\(P(X \leq \mu + \sigma z_a) = P(Z \leq z_a) = 1- a\)입니다.

95번째 값은 \(z_{0.05}\)이고, 이는 1.645입니다.

이것을 이용해서 \(Z \leq z_{0.05}\)를 이용해서, 역정규화 하면 됩니다.

 

따라서 N(3, 4)에서 95번째 값은 

\(P(X \leq 3 + (2 * z_{0.05}))= P(X \leq 3 + (2 * 1.645)) = 1 - 0.05\)이므로 6.29라는 것을 알 수 있습니다.

 

만약에 X가 평균이 m이고, 표준 편차가 a인 어떤 정규 분포라고 가정했을 때, 95%가 속하는 X의 범위를 구하라고 한다면 어떻게 구해야 할까요?

바로 범위는 m - 2a ~ m + 2a가 됩니다.

 

추가적으로 1 - k가 속하는 범위를 구하라고 한다면 얼만큼 범위를 정해야할까요?

바로 critical point를 이용해서 범위를 구하면 됩니다.

\(m - a*z_{0.5k} \sim m + a * z_{0.5k}\)

 

간단하죠?

 

이번 글에서는 표준 정규 분포를 이용해서 다양한 문제를 푸는 방법에 대해서 알아봤습니다.

감사합니다.

 

 

지적 환영합니다.