수식이 나오지 않는다면 새로고침(F5)을 해주세요
모바일은 수식이 나오지 않습니다.
📌 Random variable : 확률변수
값이 random experiment에 결정되는 양입니다. 보통 $X, Y, Z$와 같이 표시됩니다. 위에서 통계량에 대해 설명했듯이, 모두들 특정 확률분포를 따릅니다.
좀더 어렵게 설명해본다면, 표본 공간($\Omega$)에 정의된 실수 값 함수입니다. 이는 표본 공간에서 실수로 mapping해주는 것입니다. 쉽게 설명해볼까요? 표본 공간 $\Omega$에서 어떠한 실수값을 가지게 이어주는 함수와 비슷한 역할을 가지는게 확률 변수라고 생각해봅시다.
$$
y = f(x)
$$
학교에서 배운 식이죠? y는 어떠한 함수입니다. 이를 다르게 표현한다면
$$
f:X \rightarrow Y
$$
$f$라는 함수는 공간$X$에서 공간$Y$의 어떠한 값으로 이어지게 해준다. 정도로 이해하면 쉬울 것입니다. 그렇다면 확률 변수 X는 아래와 같이 표시할 수 있겠군요.
$$
X:\Omega \rightarrow \mathbb{R}
$$
$X$라는 확률 변수는 표본공간$\Omega$에서 실수공간$\mathbb{R}$의 어떠한 실수 값으로 이어지게 해준다.
◾ Type of random variable : 이산변수, 연속변수
이산변수
: 셀 수 있는 확률변수 입니다. 확률분포는 확률질량함수(probability mass function, PMF)라고 하며 아래와 같습니다.
$$
0 \leq P(X=x) \leq 1, \forall x
\\ \sum_x P(X=x) =1
$$
$\forall x$는 모든 $x$에 대하여 라는 뜻입니다. 이산 변수에 있어서 어떠한 $x$값을 가질 확률변수$X$의 확률은 0부터 1안에 있으며, 모든 $x$에 대하여 확률 변수 X의 확률의 합은 1입니다.
연속변수
: 하나 이상의 구간에서 어떤 값이나 가질 수 있는 확률 변수입니다. 확률 분포는 확률밀도함수(probability density funtion, PDF)라고 하며 아래와 같습니다.
$$
f(x) \geq 0, \forall x, \int^\infty_{-\infty}f(x) =1
\\ P(a \leq X \leq b) = \int^b_{a}f(x) dx
$$
모든 $x$에 대하여 확률은 0보다 크며, 그 확률들의 합은 1입니다. a부터 b까지의 구간에서의 확률은 a부터 b구간까지의 확률함수 $f(x)$ 적분 값입니다.
◾ 확률 변수의 기대값
: $For E|X|<\infty$
확률변수의 기대값(평균)입니다.
전에 기대값에대해 이야기해보자면 일반적으로 확률변수의 평균값을 나타냅니다. 확률변수의 경우 상수처럼 값이 정해져있는 것이 아니기 때문에 기대되는 값을 구합니다.
$$
\mu = E(X) = \begin{cases} \sum_x xP(X=x), \text{if discrete} \\
\int^\infty_{-\infty}x f(x)dx, \text{if continuous} \end{cases}
$$
기대값의 속성
1️⃣ 속성1
: $E[(aX+b)]$
- $X : \text{discrete random variable}$
- $pmf : P(X=x)$
- $a,b : \text{constants}$
위의 조건일 때 (aX+b)의 기대값은 아래와 같습니다.
$$ \begin{align} E(aX+b) &= \sum_x (ax+b)P(X=x), \ \text{becuase} \ E(X) = \sum_x xP(X=x) \\ &= a\sum_x xP(X=x) + b\sum_x P(X=x) \\ &= aE(X) +b \end{align} $$
2️⃣ 속성2
: $E[\sum^k_{i=1}X_i] = \sum^k_{i=1}E(X_i)$
$$
E[\sum^k_{i=1}X_i] = \sum^k_{i=1}E(X_i)
$$
$k$는 양수이고, $X_1,...X_k$들은 서로 독립입니다. 한번 증명해볼까요?
$$
\begin{align}
E[\sum^k_{i=1}X_i] &= E[X_1+X_2+...+X_k]
\\ &= \sum_x(\sum^k_{i=1} x_i \times P(X_1=x_1, X_2=x_x,...,X_k=x_k))
\end{align}
$$
위에서 가정한 것 처럼 확률변수들은 서로 독립이므로, 결합확률은 각 확률의 곱으로 나타낼 수 있습니다. 그럼 식은 아래와 같아집니다.
$$
\begin{align}
&\sum_x(\sum^k_{i=1} x_i \times P(X_1=x_1, X_2=x_x,...,X_k=x_k))
\\ &= \sum_x(\sum^k_{i=1} x_i \times P(X_1=x_1) \times P(X_2 = x_2) \times ... \times P(X_k =x_k))
\\ &= \sum_{i=1}^k(\sum_{x_i} x_i P(X_i=x_i))
\\ &= \sum_{i=1}^kE(X_i)
\end{align}
$$
'📊 Statistics for Basic > 기초 통계' 카테고리의 다른 글
중심극한정리 (0) | 2023.10.03 |
---|---|
확률변수의 분산과 상관계수 (0) | 2023.10.03 |
통계 기초용어를 쉽게 설명해보자. (0) | 2023.10.03 |
베이지안 이론(Bayesian theory)에 대해 알아보자. (1) | 2023.10.03 |
확률밀도함수, 확률질량함수에 대해 (1) | 2023.10.03 |