📌 표본분산의 확률 분포 = 카이제곱 분포?? 우선 가법성에 대해 간단히 설명하고 넘어가 보겠습니다. $$ X \sim \chi^2(n_1), Y \sim \chi^2(n_2) $$ 위와 같이 $X,Y$라는 확률 변수가 있고, 이 들이 서로 독립이라면 아래와 같이 합친 자유도를 따르는 카이제곱 분포를 따릅니다. $$ (X+Y) \sim \chi^2(n_1+n_2) $$ 가법성을 기억하고 표본 분산과 카이제곱의 관계를 한번 봅시다. 우선 표본분산 $S^2$는 아래와 같습니다. $$ S^2 = \sum_{i=1}^n \dfrac{(X_i - \bar{X})^2}{n-1} \\ \sum(X_i-\bar{X})^2 = (n-1)S^2 $$ 그리고 자유도가 n일 때 카이제곱 분포는 아래과 같습니다. $$ \sum..
📊 Statistics for Basic
📌 Chi-squared distribution 독립적이고 표준정규분포를 따르는 확률 변수 $Z_1, Z_2, ..., Z_n$이 있다고 하면, 자유도 n의 카이제곱 분포는 아래와 같은 확률 변수의 분포라고 합니다. $$ Q = \sum_{i=1}^n Z_i^2 = \chi_n^2 $$ 좀 더 알아본다면.. $X \sim N(\mu, \sigma)$ 일 때(정규분포를 따를 때) $Z = \frac{X-\mu}{\sigma} \sim N(0,1)$ 일겁니다.(표준화) 이 $Z$를 제곱하면 아래와 같이 자유도가 1인 카이제곱을 따르게 되는겁니다. $$ Z^2 = \dfrac{(X-\mu)^2}{\sigma^2} \sim \chi_1^2 $$ 이게 무슨 소리인지 차근차근 한번 봅시다. 카이제곱 분포 설명 우선..
📌 정규 분포 (Normal distridution) 통계를 한다면 어쩌면 가장 많이 듣지 않을까 하는 분포 중 하나인 정규 분포 입니다. 보통 수학의 분야에선 Normal distribution(정규 분포)라고 하는데, 공학쪽 에서는 Gaussian Distribution(가우시안 분포)라고 하는 것 같더라구요. 처음엔 저도 헷갈렸습니다. 우리가 진행하는 많은 통계적 분석(T-test, F-test) 등등 모두 정규분포의 성질을 활용, 가정하여 분석하게 됩니다. 정말 중요한 분포이죠. 정규분포는 bell shape(종 모양)을 띄며 양 끝 꼬리로 갈 수록 낮아지고 평균과 가까울 수록 높아지는 모양을 보입니다. 또한 분산이 커질 수록 평평한 모양을 띄고, 분산이 작을 수록 뾰족한 모양에 가깝습니다. 위 ..
연속균등 분포 포스팅 : 연속균등 분포 링크 연속균등 분포 (Continous uniform distribution) 이번엔 균등 분포에 대해 알아볼까 합니다. 그중에서도 연속형 균등 분포에 대해 알아보겠습니다. 📌 균등 분포(uniform distribution) 연속균등분포는 연속 확률 분포입니다. 분포가 특정한 범위 내 datanovice.tistory.com 📌 연속균등 분포 평균 ($E(X) = \dfrac{(a+b)}{2}$) $$ \mu = E(X) = \dfrac{(a+b)}{2} $$ ◾ 증명 연속균등 분포는 이름 그대로 연속 확률분포이고, 연속형 확률분포의 평균은 아래와 같다. $$ \int x f(x) dx $$ 연속균등 분포에서 확률 밀도 함수(pdf)는 $f(x) = \dfrac{..
이번엔 균등 분포에 대해 알아볼까 합니다. 그중에서도 연속형 균등 분포에 대해 알아보겠습니다. 📌 균등 분포(uniform distribution) 연속균등분포는 연속 확률 분포입니다. 분포가 특정한 범위 내에서 균등하게 나타나 있는 경우입니다. 출처 : 위키백과 그래프를 보시면 a부터 b까지의 합이 1이 됩니다.(확률 밀도 함수의 경우) 위 그래프는 한 범위에서 같은 값을 같는 경우의 균등 분포입니다. 한번 난수를 생성하여 확인해봅시다. import numpy as np import matplotlib.pyplot as plt # 균등 분포에서 난수 생성 np.random.seed(0) # 재현성을 위해 시드 설정 uniform_data = np.random.uniform(0, 1, 1000) # 0에..
푸아송 분포 포스팅 : 푸아송 분포 링크 푸아송 분포(Poisson distribution) 📌 푸아송 분포 (poisson distridution) 푸아송 확률변수는 일정한 시간 구간에서 발생하는 사건의 횟수를 추정하는데 유용하다. 예를들어, 시간당 톨게이트를 통과하는 자동차의 수, 시간 당 물품을 datanovice.tistory.com 📌 푸아송 분포 평균 ($E(X) = \lambda$) $$ \mu = E(X) = \lambda $$ ◾ 증명 푸아송 분포는 이산형 확률분포이고, 이산형 확률분포의 평균은 아래와 같다. $$ \sum_{x=1}^n x P(X=x) $$ 푸아송 분포에서 확률 질량 함수(pmf)는 $P(X=x)$는 $\dfrac{\lambda^x e^{-\lambda}}{x!}$이므로..
📌 푸아송 분포 (poisson distridution) 푸아송 확률변수는 일정한 시간 구간에서 발생하는 사건의 횟수를 추정하는데 유용하다. 예를들어, 시간당 톨게이트를 통과하는 자동차의 수, 시간 당 물품을 구매하는 고객 수와 같은 경우입니다. ➕ 푸아송 분포의 확률 질량 함수 푸아송 분포의 확률 질량 함수(pmf)입니다. $$ P(X=x) = \dfrac{e^{-\lambda}\lambda^x}{x!}, \forall x = 0,1,2,... \\ X \sim Poisson(\lambda), \lambda >0 $$ $P(X=x)$ : 한 구간에서 $x$건의 사건 발생확률 $\lambda$ : 한 구간에서 사건 발생 평균 횟수 $e$ : 자연상수 예로 들어 봅시다. 매장에서 시간당 평균 4명 정도 물..
베르누이 분포 포스팅 : 베르누이 분포 이항 분포, 베르누이 분포(Binomial, Bernoulli distributuin) 이번엔 베르누이 분포와 이항 분포에 대해 알아볼까 합니다! 📌 이항 분포(binomial distribution) 위키백과에 따르면 이항 분포는 연속된 n번의 독립적 시행에서 각 시행이 확률 p를 가질 때의 이산 datanovice.tistory.com 📌 베르누이 분포 평균 ($E(X) = p$) $$ \mu = E(X) = p $$ ◾ 증명 베르누이 분포는 이산확률분포이고, 이산확률분포의 평균은 아래와 같다. $$ \sum_{x=1}^n x P(X=x) $$ 베르누이 분포에서 확률 질량 함수(pmf)는 $P(X=x)$는 $p^x (1-p)^{1-x}$이므로 이를 대입하여 증명..
이항 분포 포스팅 : 이항분포. 이항 분포, 베르누이 분포(Binomial, Bernoulli distributuin) 이번엔 베르누이 분포와 이항 분포에 대해 알아볼까 합니다! 📌 이항 분포(binomial distribution) 위키백과에 따르면 이항 분포는 연속된 n번의 독립적 시행에서 각 시행이 확률 p를 가질 때의 이산 datanovice.tistory.com 📌 이항 분포 평균 ($E(X) = np$) $$ \mu = E(X) = np $$ ◾ 증명 우선 이항 분포는 이산확률분포이고, 이산확률분포의 평균은 아래와 같다. $$ \sum_{x=1}^n x P(X=x) $$ 이항 분포에서 확률 질량 함수(pmf)는 $P(X=x)$는 $\dfrac{n!}{x!(n-x)!}p^x (1-p)^{n-x}..
이번엔 베르누이 분포와 이항 분포에 대해 알아볼까 합니다! 📌 이항 분포(binomial distribution) 위키백과에 따르면 이항 분포는 연속된 n번의 독립적 시행에서 각 시행이 확률 p를 가질 때의 이산 확률 분포이다. 라고 합니다. 주사위 던지기로 예를 들어봅시다. 우리가 주사위를 10번 던져서 6이 나오는 횟수를 구한다고 할때, n은 10이 될겁니다(n=10). 10번의 독립적 시행이니까요! 그런다음 확률 P는 1/6이 되겠네요.($p=\frac16$) 주사위의 6면중에서 6이 나올확률이니까요! ➕ 이항 분포의 확률 질량 함수 이항 분포의 확률 질량 함수는 $$ Pr(X=x) = f(x;n,p) = {n \choose x}p^x(1-p)^{n-x} \\ X \sim B(n,p) $$ $$ {..