수학/확률과 통계

[확률과 통계] Exponential Distribution (지수 분포)

바보1 2022. 5. 25. 18:23

1. Exponential Distribution이란?

 

지수 분포란 failure or waiting times and inter arrival times를 위한 확률 분포이다.

일정 시간동안 발생하는 사건의 횟수가 Poisson Distribution을 따를 때, 사건과 사건 사이의 대기 시간은 Exponential Distribution을 따른다.

특정 사건이 일어나고 그 다음에 같은 사건이 일어날 때까지 걸리는 시간에 대한 분포를 말한다.

 


2. pdf(Probability Density Function) and cdf(Cumulative Distribution Function)

 

참고로 \(\lambda \)는 단위 시간동안 평균 이벤트의 발생 횟수를 말합니다.

포아송 분포와 동일합니다.

 

람다의 정의를 다시 한 번 봐야할 것 같은데, 람다는 단위 시간당 사건의 발생 횟수이고, 푸아송 분포와 지수 분포에 동시에 적용됩니다.

https://stats.stackexchange.com/questions/2092/relationship-between-poisson-and-exponential-distribution

 

Relationship between poisson and exponential distribution

The waiting times for poisson distribution is an exponential distribution with parameter lambda. But I don't understand it. Poisson models the number of arrivals per unit of time for example. How i...

stats.stackexchange.com

자세한 내용은 위를 참고하면 될 것 같습니다.

 

아래의 글은 지수 분포와 푸아송 분포에서의 람다 값에 대해 얘기하고 있습니다.

https://stats.stackexchange.com/questions/325539/lambda-exponential-vs-poisson-interpretation

 

Lambda - Exponential vs. Poisson Interpretation

I'm trying to understand $\lambda$'s role in both the Poisson and Exponential Distributions and how it is used to find probabilities (yes, I have read the other post regarding this topic, didn't qu...

stats.stackexchange.com

만약 버스가 10분에 한 대씩 도착한다면, 어떻게 생각해야 할까요?

단위 시간을 으로 한다면 람다는 1/10이 되고, 단위 시간을 로 한다면 람다는 6이 될 겁니다.

 

지수 분포의 pdf는 다음과 같습니다.

\(f(x) = \lambda e^{-\lambda x}\), for x >= 0

 

따라서 지수 분포의 cdf는 다음과 같습니다.

\(F(x) = 1 - e^{-\lambda x}\), for x >= 0, otherwise 0

이때 F(x)는 이전부터 x까지의 확률의 합이므로, x라는 시점까지 기다렸을 때의 도착 유무에 대한 확률을 알 수 있습니다.

 

즉 pdf는 해당 시점 x에 대한 확률을 말하고, cdf는 시점 x까지 기다렸을 때의 확률을 말합니다.

 

Poisson과의 관계를 봤을 때, 단위 시간 동안 이벤트가 한 번도 안 일어날 확률과 대기 시간이 단위 시간을 넘을 확률은 같아야 합니다.

 

단위 시간 동안 이벤트가 한 번도 발생하지 않을 확률 : Poisson Distribution

대기 시간이 단위 시간을 넘을 확률 : Exponential Distribution

 

람다가 1/10이라고 가정했을 때, (단위 시간을 으로 정함)

다음 분까지 이벤트가 발생하지 않을 확률 : P(X = 0) = 0.9048

대기 시간이 단위 시간을 넘을 확률 : P(X > 1) = 0.9048


3. Expectation and Variance

 

Exponential Distribution의 Expectation은 계산하면 간단히 나오겠지만,

결론만 말해서 \(E(x) = \frac{1}{\lambda}\)입니다.

또한 \(E(X^2) = \frac{2}{\lambda^2}\)이 됩니다.

 

따라서 분산 \(Var(X) = \frac{1}{\lambda^2}\)이 됩니다.

 

E(X)의 의미는 다음과 같습니다.

이벤트와 이벤트 사이의 평균 대기 시간 (혹은 공간의 크기)

 

위의 예시에서 버스가 10분에 한 대씩 도착할 때, 단위 시간을 분으로 한다면 람다는 1/10이 되고, 평균은 10이 됩니다.

따라서 버스 도착 사이의 대기 시간은 10분이고, 

만약 단위 시간을 시로 한다면 람다는 6이 되고, 평균은 1/6(시)가 됩니다.

이것 또한 버스 도착 사이의 대기 시간은 10분이 됩니다.


4. 예시

 

푸아송 분포와 지수 분포는 같은 변수인 람다를 공유하고 있습니다.

만약 푸아송 분포에 따라서 1시간 동안 평균 10번 정도의 전화를 한다고 가정하면,

지수 분포에 따라서 1시간에 평균적으로 1/10(시간)인 6분 정도 전화를 한다고 보면 되겠습니다.

 

또 다른 예시로 한 시간에 평균적으로 2명의 손님이 온다면, 푸아송 분포에서 \(\lambda\)는 2이고, 지수 분포에서도 2이겠죠?

이때, \(\frac{1}{\lambda}\)가 지수 분포의 기대값이므로 두 손님 사이의 시간의 기대값은 0.5시간입니다.


5. pth quantile

 

\(F(x) = 1 - e^{-\lambda x} = p\) 이 식을 계산하면,

\(x = -E(x)ln(1-p)\)라는 값이 나오게 됩니다.

 

따라서 median은 E(x)ln(2)이고, 

lower quantile은 E(x)ln(4/3)이고,

upper quantial은 E(x)ln(4)입니다.

 

따라서 interval of interquartile은 E(x)ln(3)이 됩니다.

 

 

 

다음 시간에는 Exponential Distribution의 Memoryless property와 Poisson Process에 대해 적도록 하겠습니다.

감사합니다.

 

 

지적 환영합니다.