수학/확률과 통계

[확률과 통계] The Distribution of Linear Combinations of Normal Random Variables (정규 확률 변수의 선형 결합 분포)

바보1 2022. 5. 26. 00:58

정규 확률 변수의 선형 결합에는 다양한 형태가 있습니다.

  1. Y = aX + b와 같은 형태
  2. 두 개의 독립 정규 확률 변수의 덧셈
  3. 독립적인 정규 확률들의 선형 결합
  4. 독립적인 정규 확률 변수의 평균

정도가 있습니다.

 

우선 Y = aX + b와 같은 형태를 보겠습니다.

 


1. Y = aX + b

 

random variable X~N(\(\mu, \sigma^2\))가 있다고 했을 때,

또 다른 random variable Y = aX + b을 가정합시다.

 

그러면 이전에 설명한 random variable의 선형 결합에 따라 Y~N(\(a\mu + b, a^2\sigma^2\))가 됩니다.

만약에 \(a=\frac{1}{\sigma}\)이고, \(b=-\frac{\mu}{b}\)라면 Y~N(0, 1)이 됩니다.

 

따라서 X~N(\(\mu, \sigma^2\))와 상수 a, b가 있을 때, Y = aX + b라면 Y~N(\(a\mu + b, a^2\sigma^2\))이 됩니다.


2. The Sum of Two Independent Normal Random Variables

 

\(X_1\sim N(\mu_1, \sigma_1^2),\,X_2\sim N(\mu_2, \sigma_2^2)\)이 있을 때,

\(Y = X_1 + X_2\)라고 합시다.

 

이렇게 된다면 

\(E(Y) = E(X_1 + X_2) = E(X_1) + E(X_2) = \mu_1 + \mu_2\)

\(Var(Y) = Var(X_1 + X_2) = Var(X_1) + Var(X_2) + 2Cov(X_1, X_2) = Var(X_1) + Var(X_2)\)

두 개의 변수가 독립이므로 Covariance는 없습니다.

 

즉 \(Y \sim N(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2)\)이 됩니다.


3. Linear Combinations of Independent Normal Random Variables

 

 

이때 \(a_i, b\)가 있다고 하고, \(Y = a_i X_i + \dots + a_n X_n, Y \sim N(\mu, \sigma^2)\)라고 합니다.

참고로 X들은 특정 a와 특정 b값에 의해 선형결합을 한 상태입니다.

 

따라서 \(\mu = a_i \mu_i + \dots + a_n \mu_n + b\)가 되고,

\(\sigma^2 = a_i^2\sigma_i^2 + \dots + a_n^2 \sigma_n^2\)이 됩니다.


4. Averaging Independent Random Variables

 

 

\(X_i \sim N(\mu_i, \sigma_i^2)\)​이고, \(\bar{X} = \frac{(X_1 + \dots + X_n)}{n}\)

이때 \(E(\bar{X})=E(\frac{1}{n} X_1 + \dots + \frac{1}{n} X_n) = \frac{1}{n}E(X_1) + \dots \frac{1}{n}E(X_n) = \mu​\)이 됩니다.

Variance는 \(\frac{\sigma^2}{n}\)이 됩니다.

 

이때는 위의 여러 개의 랜덤 변수의 선형 결합이 아니라, 그냥 단순히 랜덤 변수들의 평균입니다. 

 

따라서 \(\bar{X} \sim N(\mu, \frac{\sigma^2}{n})\)이 됩니다.

 

즉 Averaging을 많이 하면 분산은 작아집니다. => 가운데에 몰리는 현상이 나타납니다.

 

 

 

이상으로 선형 결합에 대한 정리는 마치겠습니다.

다음 글에는 Normal Approximation to the Binomial Distribution에 대한 글을 쓰도록 하겠습니다.

감사합니다.

 

 

지적 환영합니다.