수학/확률과 통계

[확률과 통계] Normal Distribution (정규 분포)

바보1 2022. 5. 25. 20:35

1. Normal Distribution이란?

 

 

정규 분포란 좌우가 대칭인 분포를 말합니다.

이때 평균이 μ이고, 분산이 σ2인 정규 분포의 pdf는 아래와 같습니다.

f(x)=1σ2πe(xμ)22σ2,forx이고,

이때 X~N(μ,σ2)라고 합니다.

 

만약 분산이 커지면 정규 분포는 완만하고 낮은 곡선을 가지게 됩니다. (옆으로 넓게 퍼진 형태)


2. Standard Normal Distribution

 

 

Standard Normal Distribution이란 평균이 0이고 분산이 1인 정규 분포를 말합니다.

X~N(μ,σ2)인 정규 분포를 정규화한 정규 분포를 Y라고 합시다.

따라서 Y=Xμσ=1σX+(μσ) 입니다.

 

따라서 E(Y) = 0이 되고, V(Y) = 1이 됩니다.

위의 식에서 보시면 아시겠지만 일반적인 normal distribution으로는 확률 값을 구하기 어렵습니다. pdf가 너무 더럽기 때문이죠...

따라서 우리는 normal distribution을 standard normal distribution으로 변환(정규화)해서 확률을 계산합니다.

Z=Xμσ으로 정규화한 다음에 확률 값을 계산합니다.

 

따라서 Standard Normal Distribution의 pdf는 ϕ(x)=12πex22이 됩니다.

그리고 표준 정규 분포의 cdf는 Φ(x)=xϕ(y)dy이 됩니다.

 

참고로 표준 정규 분포에서 Φ(0)=0.5 입니다. 왜냐하면 pdf가 symmetric이기 때문입니다.

또한, 이런 성질도 가지고 있습니다.

1Φ(x)=P(Zx)=P(Zx)=Φ(x)

Φ(x)+Φ(x)=1

 

이때 80th percentile을 찾는 법도 간단합니다.

Φ(x)=0.8 을 만족하는 x 값을 확률 값 테이블에서 찾으면 됩니다.

 

만약에 P(|Z| < x) = 0.7이라고 한다면, Φ(x)=0.15 인 값을 찾으면 됩니다.

 

 

다음 글부터는 좀 더 표준 정규 분포에 대한 설명을 하도록 하겠습니다.

감사합니다.

 

 

지적 환영합니다.