📊 Statistics for Basic/Distribution(분포)

📌 초기하 분포(hypergeometric distribution) 초기하 분포란 비복원추출에서 모집단 N 중에 n번 추출했을 때, 원하는 것이 k번 나올 확률에 대한 분포입니다. 이렇게 보면 굉장히 어려워보이는데 별거 없습니다. 이항분포에서 복원추출이 아닌 비복원추출을 하는 것이라고 간단히 이해하고 있으면 됩니다. 자세히 한번 봅시다! 예를 들어 상자 안에 공 7개가 있고, 빨간 공 4개와 파란공 3개가 있다고 해봅시다. 우리는 총 4개의 공을 뽑아서 빨간 공 3개를 뽑으려고 합니다. 모집단인 N = 7이고, n = 4번 추출하며, 원하는 빨간 공이 k = 3번 나올 확률에 대한 분포를 보는 것입니다. 이 때 초기하확률변수 X = 3이 되는겁니다. ➕ 초기하 분포의 확률 질량 함수 모집단 N 총 시행 ..
📌 표본분산의 확률 분포 = 카이제곱 분포?? 우선 가법성에 대해 간단히 설명하고 넘어가 보겠습니다. $$ X \sim \chi^2(n_1), Y \sim \chi^2(n_2) $$ 위와 같이 $X,Y$라는 확률 변수가 있고, 이 들이 서로 독립이라면 아래와 같이 합친 자유도를 따르는 카이제곱 분포를 따릅니다. $$ (X+Y) \sim \chi^2(n_1+n_2) $$ 가법성을 기억하고 표본 분산과 카이제곱의 관계를 한번 봅시다. 우선 표본분산 $S^2$는 아래와 같습니다. $$ S^2 = \sum_{i=1}^n \dfrac{(X_i - \bar{X})^2}{n-1} \\ \sum(X_i-\bar{X})^2 = (n-1)S^2 $$ 그리고 자유도가 n일 때 카이제곱 분포는 아래과 같습니다. $$ \sum..
📌 Chi-squared distribution 독립적이고 표준정규분포를 따르는 확률 변수 $Z_1, Z_2, ..., Z_n$이 있다고 하면, 자유도 n의 카이제곱 분포는 아래와 같은 확률 변수의 분포라고 합니다. $$ Q = \sum_{i=1}^n Z_i^2 = \chi_n^2 $$ 좀 더 알아본다면.. $X \sim N(\mu, \sigma)$ 일 때(정규분포를 따를 때) $Z = \frac{X-\mu}{\sigma} \sim N(0,1)$ 일겁니다.(표준화) 이 $Z$를 제곱하면 아래와 같이 자유도가 1인 카이제곱을 따르게 되는겁니다. $$ Z^2 = \dfrac{(X-\mu)^2}{\sigma^2} \sim \chi_1^2 $$ 이게 무슨 소리인지 차근차근 한번 봅시다. 카이제곱 분포 설명 우선..
📌 정규 분포 (Normal distridution) 통계를 한다면 어쩌면 가장 많이 듣지 않을까 하는 분포 중 하나인 정규 분포 입니다. 보통 수학의 분야에선 Normal distribution(정규 분포)라고 하는데, 공학쪽 에서는 Gaussian Distribution(가우시안 분포)라고 하는 것 같더라구요. 처음엔 저도 헷갈렸습니다. 우리가 진행하는 많은 통계적 분석(T-test, F-test) 등등 모두 정규분포의 성질을 활용, 가정하여 분석하게 됩니다. 정말 중요한 분포이죠. 정규분포는 bell shape(종 모양)을 띄며 양 끝 꼬리로 갈 수록 낮아지고 평균과 가까울 수록 높아지는 모양을 보입니다. 또한 분산이 커질 수록 평평한 모양을 띄고, 분산이 작을 수록 뾰족한 모양에 가깝습니다. 위 ..
연속균등 분포 포스팅 : 연속균등 분포 링크 연속균등 분포 (Continous uniform distribution) 이번엔 균등 분포에 대해 알아볼까 합니다. 그중에서도 연속형 균등 분포에 대해 알아보겠습니다. 📌 균등 분포(uniform distribution) 연속균등분포는 연속 확률 분포입니다. 분포가 특정한 범위 내 datanovice.tistory.com 📌 연속균등 분포 평균 ($E(X) = \dfrac{(a+b)}{2}$) $$ \mu = E(X) = \dfrac{(a+b)}{2} $$ ◾ 증명 연속균등 분포는 이름 그대로 연속 확률분포이고, 연속형 확률분포의 평균은 아래와 같다. $$ \int x f(x) dx $$ 연속균등 분포에서 확률 밀도 함수(pdf)는 $f(x) = \dfrac{..
이번엔 균등 분포에 대해 알아볼까 합니다. 그중에서도 연속형 균등 분포에 대해 알아보겠습니다. 📌 균등 분포(uniform distribution) 연속균등분포는 연속 확률 분포입니다. 분포가 특정한 범위 내에서 균등하게 나타나 있는 경우입니다. 출처 : 위키백과 그래프를 보시면 a부터 b까지의 합이 1이 됩니다.(확률 밀도 함수의 경우) 위 그래프는 한 범위에서 같은 값을 같는 경우의 균등 분포입니다. 한번 난수를 생성하여 확인해봅시다. import numpy as np import matplotlib.pyplot as plt # 균등 분포에서 난수 생성 np.random.seed(0) # 재현성을 위해 시드 설정 uniform_data = np.random.uniform(0, 1, 1000) # 0에..
푸아송 분포 포스팅 : 푸아송 분포 링크 푸아송 분포(Poisson distribution) 📌 푸아송 분포 (poisson distridution) 푸아송 확률변수는 일정한 시간 구간에서 발생하는 사건의 횟수를 추정하는데 유용하다. 예를들어, 시간당 톨게이트를 통과하는 자동차의 수, 시간 당 물품을 datanovice.tistory.com 📌 푸아송 분포 평균 ($E(X) = \lambda$) $$ \mu = E(X) = \lambda $$ ◾ 증명 푸아송 분포는 이산형 확률분포이고, 이산형 확률분포의 평균은 아래와 같다. $$ \sum_{x=1}^n x P(X=x) $$ 푸아송 분포에서 확률 질량 함수(pmf)는 $P(X=x)$는 $\dfrac{\lambda^x e^{-\lambda}}{x!}$이므로..
📌 푸아송 분포 (poisson distridution) 푸아송 확률변수는 일정한 시간 구간에서 발생하는 사건의 횟수를 추정하는데 유용하다. 예를들어, 시간당 톨게이트를 통과하는 자동차의 수, 시간 당 물품을 구매하는 고객 수와 같은 경우입니다. ➕ 푸아송 분포의 확률 질량 함수 푸아송 분포의 확률 질량 함수(pmf)입니다. $$ P(X=x) = \dfrac{e^{-\lambda}\lambda^x}{x!}, \forall x = 0,1,2,... \\ X \sim Poisson(\lambda), \lambda >0 $$ $P(X=x)$ : 한 구간에서 $x$건의 사건 발생확률 $\lambda$ : 한 구간에서 사건 발생 평균 횟수 $e$ : 자연상수 예로 들어 봅시다. 매장에서 시간당 평균 4명 정도 물..
베르누이 분포 포스팅 : 베르누이 분포 이항 분포, 베르누이 분포(Binomial, Bernoulli distributuin) 이번엔 베르누이 분포와 이항 분포에 대해 알아볼까 합니다! 📌 이항 분포(binomial distribution) 위키백과에 따르면 이항 분포는 연속된 n번의 독립적 시행에서 각 시행이 확률 p를 가질 때의 이산 datanovice.tistory.com 📌 베르누이 분포 평균 ($E(X) = p$) $$ \mu = E(X) = p $$ ◾ 증명 베르누이 분포는 이산확률분포이고, 이산확률분포의 평균은 아래와 같다. $$ \sum_{x=1}^n x P(X=x) $$ 베르누이 분포에서 확률 질량 함수(pmf)는 $P(X=x)$는 $p^x (1-p)^{1-x}$이므로 이를 대입하여 증명..
이항 분포 포스팅 : 이항분포. 이항 분포, 베르누이 분포(Binomial, Bernoulli distributuin) 이번엔 베르누이 분포와 이항 분포에 대해 알아볼까 합니다! 📌 이항 분포(binomial distribution) 위키백과에 따르면 이항 분포는 연속된 n번의 독립적 시행에서 각 시행이 확률 p를 가질 때의 이산 datanovice.tistory.com 📌 이항 분포 평균 ($E(X) = np$) $$ \mu = E(X) = np $$ ◾ 증명 우선 이항 분포는 이산확률분포이고, 이산확률분포의 평균은 아래와 같다. $$ \sum_{x=1}^n x P(X=x) $$ 이항 분포에서 확률 질량 함수(pmf)는 $P(X=x)$는 $\dfrac{n!}{x!(n-x)!}p^x (1-p)^{n-x}..
Data_novice
'📊 Statistics for Basic/Distribution(분포)' 카테고리의 글 목록