수학/확률과 통계

[확률과 통계] Standard Normal Distribution (표준 정규 분포), Standard Normal Distribution의 다양한 속성

바보1 2022. 5. 25. 21:47

1. Critical Point : z_a

 

za는 표준 정규 분포의 critical point라고 합니다. 

남은 면적을 a로 만드는 값을 za라고 합니다.

 

이때 za는 (1-a) * 100 percentile를 만드는 값이라고도 볼 수 있습니다. (이때 a < 0.5)

또한 Φ(za)=1a입니다.

마지막으로 가장 중요한 특징이 있는데, 이는 정규 분포의 대칭성을 활용한 특징입니다.

P(|Z|za/2)=P(za/2Zza/2)=Φ(za/2)Φ(za/2)=(1a/2)a/2=1a

위의 식은 같은 면적을 이분할해서 대칭으로 만들어서 해결한 특징입니다.

 


2. Normal Distribution의 정규화를 통한 확률 값 계산

 

 

만약 어떤 확률 분포 X가 N(μ,σ2)를 따른다고 가정해봅시다.

이때 a와 b 사이의 값을 어떻게 찾을까요?

정규 분포에서 a와 b 사이의 값을 찾는 것은 너무나 구하기 힘듭니다.

따라서 우리는 이러한 분포를 Standard Normal Distribution으로 변환해서 손쉽게 계산할 수 있습니다.

 

P(aXb)=P(aμσXμσbμσ)=P(aμσZbμσ)=Φ(bμσ)Φ(aμσ)

이해가 되시나요?

이렇게 우리는 정규 분포를 표준 정규 분포로 변환하여 계산합니다.

 


3. General Normal Distribution

 

 

일반적으로 X~N(μ,σ2)를 따릅니다.

이때 P(μcσXμ+cσ)=P(cZc)라는 식이 탄생하게 됩니다.

 

즉, 앞의 식에서 c = 1이라면 -1 ~ 1까지의 범위 안에 있는 확률 값이므로 약 68%가 범위 안에 들어가게 됩니다.

마찬가지로 c = 2이라면 95%가 범위 안에 들어갑니다.

마지막으로 c = 3이라면 99.7%가 범위 안에 들어갑니다.

 

따라서 95%의 확률을 가지는 범위를 알고 싶다면, P(2Z2)를 통해서 X를 변환하면 됩니다.

또는 그냥 "평균 - 2 * 표준 편차 ~ 평균 + 2 * 표준 편차"가 범위가 되겠네요.

 

추가적으로 Critical Point를 이용해서 범위를 풀 수도 있습니다.

P(Xμ+σza)=P(Zza)=1a입니다.

95번째 값은 z0.05이고, 이는 1.645입니다.

이것을 이용해서 Zz0.05를 이용해서, 역정규화 하면 됩니다.

 

따라서 N(3, 4)에서 95번째 값은 

P(X3+(2z0.05))=P(X3+(21.645))=10.05이므로 6.29라는 것을 알 수 있습니다.

 

만약에 X가 평균이 m이고, 표준 편차가 a인 어떤 정규 분포라고 가정했을 때, 95%가 속하는 X의 범위를 구하라고 한다면 어떻게 구해야 할까요?

바로 범위는 m - 2a ~ m + 2a가 됩니다.

 

추가적으로 1 - k가 속하는 범위를 구하라고 한다면 얼만큼 범위를 정해야할까요?

바로 critical point를 이용해서 범위를 구하면 됩니다.

maz0.5km+az0.5k

 

간단하죠?

 

이번 글에서는 표준 정규 분포를 이용해서 다양한 문제를 푸는 방법에 대해서 알아봤습니다.

감사합니다.

 

 

지적 환영합니다.