수식이 나오지 않는다면 새로고침(F5)을 해주세요
모바일은 수식이 나오지 않습니다.
📌 초기하 분포(hypergeometric distribution)
초기하 분포
란 비복원추출에서 모집단 N 중에 n번 추출했을 때, 원하는 것이 k번 나올 확률에 대한 분포입니다. 이렇게 보면 굉장히 어려워보이는데 별거 없습니다. 이항분포에서 복원추출이 아닌 비복원추출을 하는 것이라고 간단히 이해하고 있으면 됩니다. 자세히 한번 봅시다!
예를 들어 상자 안에 공 7개가 있고, 빨간 공 4개와 파란공 3개가 있다고 해봅시다. 우리는 총 4개의 공을 뽑아서 빨간 공 3개를 뽑으려고 합니다.
모집단인 N = 7이고, n = 4번 추출하며, 원하는 빨간 공이 k = 3번 나올 확률에 대한 분포를 보는 것입니다. 이 때 초기하확률변수 X = 3
이 되는겁니다.
➕ 초기하 분포의 확률 질량 함수
- 모집단 N
- 총 시행 횟수 n
- 원하는 집단의 크기 m
일 때 확률질량함수는
$$
X \sim hypergeo(N, m, n)
$$
$$
P(X = x) = \dfrac{_mC_x \cdot _{(N-m)}C_{(n-x)}}{_NC_n}
$$
입니다. 한번 예시를 적용해서 보겠습니다!
이렇게 그림과 같고 앞서 말한 예시 처럼 빨간 공이 3번 나올 때
확률질량함수는 = 가방안에 빨간공 4개, 파란공 3개로 총 7개 공이 있고, 비복원추출로 5번을 뽑았을 때, 빨간공이 3개 나올 확률
$$
P(X = 3) = \dfrac{_4C_3 \cdot _{(7-4)}C_{(5-3)}}{_7C_5} \ = \dfrac{4 \cdot 3}{21} = \frac47 = 0.5714
$$
식을 한번 풀어 써볼게요.
$$
\dfrac{\text{빨간공 전체 중 3개 뽑기} \cdot \text{파란공 전체중에 2개 뽑기}}{\text{전체 중 5개 뽑기}}
$$
이렇게 되겠네요. 추가로 빨간 공을 0개에서 부터 4개 까지 뽑았을 때의 값으로 그래프 표현해봅시다.
x = c(0:7)
y = dhyper(x=c(0:7), m=4, n=3, k=5)
data1 = data.frame(x, y)
ggplot(data1, aes(x = x,
y = y)) +
geom_point(color = 'steelblue') +
geom_segment(aes(xend = x, yend = 0), color = 'steelblue', size = 1)+
theme_light() +
scale_x_continuous(breaks = seq(0, 7, 1)) +
labs(title = '7개의 공 중에 빨간공 x개 뽑는 확률질량함수',
x = '빨간 공 뽑는 횟수',
y= '확률')
◾ 초기하 확률 변수 평균과 분산
평균 : $E(X) = \dfrac{nm}{N}$
분산 : $Var(X) = \left( \dfrac{N-n}{N-1} \right) \cdot n \cdot \dfrac{m}{N} \cdot \left( 1- \dfrac{m}{N} \right)$
이해가 되셨을까요? 뭔가 이름 자체가 초기하 라서 어려워 보이는데 실상은 그렇지 않답니다! 물론 깊게 들어간다면 어렵겠지만 당장 이게 어떤걸 말하는 가는 이해할 수 있겠습니다!
이상 초기하 분포 였습니다! ☠️
참고
[기초통계] 초기하분포 의미 및 개념 정리 - 로스카츠의 AI 머신러닝
R, Python 분석과 프로그래밍의 친구 (by R Friend) :: R 초기하분포 (Hypergeometric distribution) : dhyper(x, m, n, k)
초기하 분포 - 위키백과, 우리 모두의 백과사전
'📊 Statistics for Basic > Distribution(분포)' 카테고리의 다른 글
표본 분산의 확률 분포가 카이제곱 분포인가 (0) | 2023.11.25 |
---|---|
카이제곱 분포 (Chi-squared distribution) (1) | 2023.11.25 |
정규 분포와 표준 정규 분포 (Normal and Strand Normal Distribution) (0) | 2023.11.25 |
연속균등 분포 평균, 분산 증명 (1) | 2023.11.25 |
연속균등 분포 (Continous uniform distribution) (1) | 2023.11.25 |