정규 확률 변수의 선형 결합에는 다양한 형태가 있습니다.
- Y = aX + b와 같은 형태
- 두 개의 독립 정규 확률 변수의 덧셈
- 독립적인 정규 확률들의 선형 결합
- 독립적인 정규 확률 변수의 평균
정도가 있습니다.
우선 Y = aX + b와 같은 형태를 보겠습니다.
1. Y = aX + b
random variable X~N(\(\mu, \sigma^2\))가 있다고 했을 때,
또 다른 random variable Y = aX + b을 가정합시다.
그러면 이전에 설명한 random variable의 선형 결합에 따라 Y~N(\(a\mu + b, a^2\sigma^2\))가 됩니다.
만약에 \(a=\frac{1}{\sigma}\)이고, \(b=-\frac{\mu}{b}\)라면 Y~N(0, 1)이 됩니다.
따라서 X~N(\(\mu, \sigma^2\))와 상수 a, b가 있을 때, Y = aX + b라면 Y~N(\(a\mu + b, a^2\sigma^2\))이 됩니다.
2. The Sum of Two Independent Normal Random Variables
\(X_1\sim N(\mu_1, \sigma_1^2),\,X_2\sim N(\mu_2, \sigma_2^2)\)이 있을 때,
\(Y = X_1 + X_2\)라고 합시다.
이렇게 된다면
\(E(Y) = E(X_1 + X_2) = E(X_1) + E(X_2) = \mu_1 + \mu_2\)
\(Var(Y) = Var(X_1 + X_2) = Var(X_1) + Var(X_2) + 2Cov(X_1, X_2) = Var(X_1) + Var(X_2)\)
두 개의 변수가 독립이므로 Covariance는 없습니다.
즉 \(Y \sim N(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2)\)이 됩니다.
3. Linear Combinations of Independent Normal Random Variables
이때 \(a_i, b\)가 있다고 하고, \(Y = a_i X_i + \dots + a_n X_n, Y \sim N(\mu, \sigma^2)\)라고 합니다.
참고로 X들은 특정 a와 특정 b값에 의해 선형결합을 한 상태입니다.
따라서 \(\mu = a_i \mu_i + \dots + a_n \mu_n + b\)가 되고,
\(\sigma^2 = a_i^2\sigma_i^2 + \dots + a_n^2 \sigma_n^2\)이 됩니다.
4. Averaging Independent Random Variables
\(X_i \sim N(\mu_i, \sigma_i^2)\)이고, \(\bar{X} = \frac{(X_1 + \dots + X_n)}{n}\)
이때 \(E(\bar{X})=E(\frac{1}{n} X_1 + \dots + \frac{1}{n} X_n) = \frac{1}{n}E(X_1) + \dots \frac{1}{n}E(X_n) = \mu\)이 됩니다.
Variance는 \(\frac{\sigma^2}{n}\)이 됩니다.
이때는 위의 여러 개의 랜덤 변수의 선형 결합이 아니라, 그냥 단순히 랜덤 변수들의 평균입니다.
따라서 \(\bar{X} \sim N(\mu, \frac{\sigma^2}{n})\)이 됩니다.
즉 Averaging을 많이 하면 분산은 작아집니다. => 가운데에 몰리는 현상이 나타납니다.
이상으로 선형 결합에 대한 정리는 마치겠습니다.
다음 글에는 Normal Approximation to the Binomial Distribution에 대한 글을 쓰도록 하겠습니다.
감사합니다.
지적 환영합니다.