수학/확률과 통계

[확률과 통계] Exponential Distribution의 Memoryless Property, Poisson Process (지수 분포의 무기억성과 푸아송 프로세스)

바보1 2022. 5. 25. 19:18

1. Memoryless Property

 

지수 함수가 무기억성의 성질을 가지고 있다는 것은 말 그대로 무기억성을 가지고 있다는 의미입니다.

예를 들어서 로또가 있다고 가정합시다.

이전 회차의 당첨 번호가 다음 회차에 영향을 끼치나요?

전 회차랑 다음 회차가 아무런 상관이 없습니다.

이렇게 기억하지 못한다고 해서 무기억성, 즉 Memoryless Property라고 합니다.

 

그렇다면 간단하게 설명하겠습니다.

어떤 X는 지수 분포를 따르고, X는 특정 사건이 일어나기 전까지의 시간을 잰다고 가정합시다.

이때 \(x_0\)라는 시간까지 아무런 특정 사건이 일어나지 않았다고 하면, 해당 확률을 계산하는 식은 \(P(X \geq x_0)\)이 됩니다.

 

참고로 \(X \geq x_0\)이므로 \(1 - F(x)\)입니다.

 

여기까지는 아무런 문제가 없습니다.

X가 x_0 시간까지는 아무런 사건이 일어나지 않았고, x_0 이후에는 사건이 일어날 수 있는거니까요.

 

이때 Y라는 애는 이벤트가 발생하기 전에 경과되는 x_0 이후의 추가 시간이라고 가정합시다.

만약에 y라는 추가 시간이 흘렀다고 가정합시다.

그런데도 아무런 사건이 일어나지 않았다고 가정한다면, 해당 확률을 계산하는 식은 \(P(Y \geq y)\)이 됩니다.

 

엥? 그렇다면 이 식은 X가 x_0까지 측정했을 때, 아무런 일이 일어나지 않을 확률이 있을 때, x_0 + y 시간이 추가로 흘렀을 때, 아무런 일이 일어나지 않은 확률이 아닌가요?

즉 조건부 확률이 됩니다.

따라서 위의 식을 X에 대해서 표현하면 다음과 같습니다.

\(P(X \geq x_0 + y | X \geq x_0)\) = 

\(\frac{P(X \geq x_0 + y)}{X \geq x_0} = \frac{e^{-\lambda(x_0 + y)}}{e^{-\lambda x_0}} = e^{-\lambda y}\)

 

이해가 되시나요?

 

쉽게 말해서 0부터 y시간까지 아무런 이벤트가 일어나지 않을 확률은 x_0부터 x_0 + y까지 아무런 이벤트가 일어나지 않을 확률과 같습니다.

 

따라서 과거를 전혀 기억하지 못한다고 해서 Memoryless Property, 무기억성을 가지고 있다고 말하는 것입니다.

 

예를 들어서 평균적으로 1000km를 갈 수 있는 배터리를 가진 차가 있다고 가정해봅시다.

그리고 이 배터리는 지수 분포를 따른다고 합니다.

이때, 저는 500km 여행을 가기로 결심했습니다.

이때 제가 무사히 배터리 교환이 없이 여행을 갈 수 있는 확률은 쉽게 구할 수 있죠?

 

근데 여기서 추가로 제가 이미 200km를 왔다고 가정해봅시다. 여기서 배터리의 소모는 고려하지 않습니다.

아무튼 이미 200km를 무사히 왔는데, 500km를 더 가고 싶어서 계산해도 위와 똑같은 확률이 나옵니다.

 

왜냐면 이미 200km를 무사히 왔다는 것을 바탕으로 조건부 확률을 계산해야 하기 때문입니다.

즉 200km를 무사히 갔을 때, 700km 또한 무사히 갈 확률과 그냥 500km를 무사히 갈 확률은 같다는 뜻입니다.

 

따라서 Exponential Distribution은 Memoryless Property를 가지고 있다고 볼 수 있습니다.

 


2. Poisson Process

 

다양한 확률론적 과정 중에 랜덤 이벤트의 시리즈가 있습니다.

이때 특정 stochastic process 중에 인접 이벤트 사이의 시간 간격에 대해 분포를 하는 process가 있고,

이때 Exponential Distribution을 time intervals로 하는 Process를 Poisson Process로 라고 합니다.

 

즉 푸아송 분포와 지수 분포를 연결하는 것입니다.

푸아송 과정에서 평균적으로 일어나는 사건의 횟수를 \(\lambda\)라고 합시다.

그렇다면 두 사건의 Expected waiting time은 \(\frac{1}{\lambda}\)가 됩니다.

왜냐면 푸아송 분포와 지수 분포는 같은 파라미터를 공유하기 때문입니다.

 

또한 특정 시간 t동안 발생할 이벤트의 기대값은 \(\lambda t\)가 됩니다.

추가적으로 t라는 시간 동안 이벤트가 발생하는 경우의 수는 평균이 \(\lambda t\)라는 푸아송 분포를 가지고 있습니다.

 

이때 X가 특정 시간 간격 t안의 이벤트 발생에 대한 횟수를 센다면 X~P(\(\lambda\)t)라고 할 수 있습니다.

 

 

 

개인적으로 굉장히 이해하기 어려웠던 부분입니다.

상식적으로 무기억성이라는 부분도 이해하기도 힘들었고, 푸아송 프로세스도 이해하기 너무 어려웠습니다.

예를 들어 버스가 언제 출발한지 몰랐다고 가정하고, 나는 버스를 기다린다고 가정합시다.

버스가 5분 뒤에도 안 왔을 때, 10분까지 안 올 확률과, 그냥 5분 뒤에도 안 올 확률이 같다는 건 너무 이해하기 어렵네요..아무튼,,,예시가 잘못 되었을 수도 있는데 그렇습니다...

 

그리고 푸아송 프로세스도 그냥 지수 분포와 푸아송 분포가 같은 파라미터를 공유하니까 이를 이용해서 지수 분포와 푸아송 분포를 엮은 것 같습니다..

 

아무튼 감사합니다.

 

 

지적 환영합니다.