수학/확률과 통계

[확률과 통계] CH03 - Probability and Statistics

바보1 2022. 4. 13. 02:19
  • 두 가지 상황만 존재할 때, 성공의 확률이 p이면 E(x) = p, Var(x) = p(1-p)이다.
  • Binomial Distribution
    • 두 가지 상황만 존재함. n번 시도하고 확률은 p임
    • X = X1 + ... Xn
    • P(X=x) = (n, x) p^x (1-p)^n-x
    • n번 시도했을 때, x번 성공할 확률
    • E(x) = np, Var(x) = np(1-p)
    • (n, x) = nCx임
    • Y = X/n이이고, E(x) = np, Var(x) = np(1-p)라면 
    • E(y) = p, Var(y) = p(1-p)/n
  • Geometric Distribution
    • the probability value of xth success
    • x번째에 성공할 확률 (계속 실패하다가)
    • P(X=x) = (1-p)^x-1 * p
    • E(x) = 1/p -> 확률의 역수
    • var(x) = (1-p)/p^2
    • cdf : cdf(x) = 1 - (1-p)^x -> x번 시도했을 때 다 실패
  • Negative Binomial Distribution
    • x번 시도해서 r번째의 성공 확률
    • P(X=x) = (x-1, r-1) p^r-1 * (1-p)^x-r * p
    • x-1번 시도에서 r-1번을 뽑고, 마지막에 성공하는 확률
    • E(x) = r/p
    • var(x) = r(1-p)/p^2
    • 평균 분산 둘 다 Geometric에서 r을 곱함
    • 이때 만약에 r이 1이라면 Geometric과 다를게 없음
  • Hypergeometric Distribution
    • N개 중에 r개가 a certain kind임
    • 이때 n번 시도함
    • 만약 교환한다면 (같은 아이템이 또 뽑힐 수 있음)
      • Binomial로 계산하면 됨
      • B(n, r/N)
    • 만약 교환하지 않는다면 (같은 아이템이 두 번 이상 안 뽑힘)
      • 확률이 계속 달라지므로 특수한 함수가 필요함
      • pdf P(X=x) = (r,x)*(N-r,n-x)/(N,n)
      • N개 중에 n개를 뽑고, r개중에 x개를 뽑고, 나머지 N-r개 중에 n-x개를 뽑음
      • r개중에 x개를 뽑는게 certain kind이고, N-r개 중에 n-x개를 뽑는건 정상인 것
      • 이때 범위는 max(0, n+r-N) <= x <= min(n, r)임
      • 만약 5개를 뽑고, 특수한게 5개고 전체 수가 9면은 x는 필연적으로 1이상이어야함
      • 또한 5개를 뽑는데, 특수한게 3개면은 최대 3개이고, 5개를 뽑는데, 특수한게 8개면 최대 5개임
      • 암튼 교환하지 않는다면
        • E(x) = n*r/N -> Binomial이랑 똑같은듯?
        • Var(x) = (N-n / N-1) * n * r/N * (1-r/N)임
        • npq까지는 Binomial이라 같은데 앞에 (N-n / N-1)이 붙어있음
      • 만약 N이 충분히 크다면 근사치로 Binomial로 계산해도 되긴함
  • Poisson Distribution
    • 어떤 특정한 기간 내에 평균 횟수를 말함
    • 특정한 횟수 y를 말함
    • pmd P(X=x) = e^-y * y^x / x!
    • 모두 더하면 1이 나옴, E(x) = y, var(x) = y임
    • 만약 n이 충분히 크고, p가 충분히 작다면 y = np로 간주해도 됨
    • 고로 n횟수와 p확률이 나오면 평균 횟수는 np이고, 위 상황이라면 y = np임
    • 그에 따라서 구하면 될 듯?
    • 만약에 y = 3이고, P(x = 0)을 구하라면, e^-3임
    • Poisson은 범위가 무한이기 때문에 P(X >= 2) 같은거는 1 - P(0) - P(1)로 계산해야함
    • 이때 일주일에 평균 횟수가 47이라고 할 때, 하루에 10명 이하로 올 확률을 구하라고 하면, 하루 단위로 평균을 바꾸고 계산해야함
    • y_day = 47/7 = 6.71임
  • Multinomial Distribution
    • 이제는 두 가지의 상황이 아니라 여러 가지의 상황에 대한 확률이 주어짐
    • x1일 확률은 p1, x2일 확률은 p2 .....
    • P(X1 = x1, X2 = x2, ... , Xn = xn) = (n! / x1! * x2! * ... * xn!) * p1^x1 * p2^x2 * ... * pn^xn임
    • E(Xi) = npi, var(xi) = npi(1-pi)
    • 만약 3가지 상황중에 단 하나만 고려한다면 Binomial으로 계산하면 됨

 

ㅠㅠ