確率変数の期待値と分散
期待値
確率変数 \( X \) に対して、期待値は \( E[X] \) という関数で表記されます。(Eはexpendの略です。)
以下、確率変数 \( X \) が離散型変数と連続型変数の場合に分けてご紹介します。
離散型変数の場合
サイコロの目やコインの表裏など、離散型の値が確率変数となる場合を考えます。
ある事象 \( x \) が起こる確率を \( P[X=x] \) とすると、期待値 \( E[X] \) は以下で定義されます。
$$ E[X]=\sum_{x \in {X}} xP[X=x] $$
例としてサイコロの出る目の期待値を計算しましょう。
確率変数 \( X \) は、以下となります。
$$ X = \{ 1,2,\cdots,6 \} $$
次に、各事象が起こる確率は以下となります。
$$ P[X=1]=P[X=2]=\cdots=P[X=6]=\frac{1}{6} $$
これより、期待値 \( E[X] \) を算出します。
\begin{eqnarray}
E[X]&=&\sum_{x \in {X}} xP[X=x] \\
&=&1 \times \frac{1}{6} + 2 \times \frac{1}{6} + \cdots 6 \times \frac{1}{6} \\
&=&3.5
\end{eqnarray}
従って、サイコロの出る目の期待値は \( 3.5 \) となります。
連続型変数の場合
地震の発生間隔や電池の寿命など、連続型の値が確率変数となる場合を考えます。
ある事象 \( x \) が起こる確率を \( f(x) \) とすると、期待値 \( E[X] \) は以下で定義されます。
$$ E[X]=\int_{x \in {X}} xf(x)dx $$
例としての地震の発生間隔の期待値を計算しましょう。
確率変数 \( X \) を発生間隔とすると、以下となります。
$$ X := (0,\;+\infty ) $$
次に、事象 \( x \in X \) が起こる確率は以下となります。
$$ f(x) = \frac{1}{120}e^{-\frac{1}{120}x} $$
この \( f(x) \) は確率密度関数と呼ばれます。
これより、期待値 \( E[X] \) を算出します。
\begin{eqnarray}
E[X]&=&\int_{x \in {X}} xf(x)dx \\
&=&\int_{0}^{+\infty} x \cdot \frac{1}{120}e^{-\frac{1}{120}x} dx \\
&=&\frac{1}{120} \int_{0}^{+\infty} x e^{-\frac{1}{120}x} dx \\
&=&\frac{1}{120} \cdot (-120) \left\{ \left[ x e^{-\frac{1}{120}x} \right]_{0}^{+\infty} – \int_{0}^{+\infty} e^{-\frac{1}{120}x} dx \right\} \\
&=&\int_{0}^{+\infty} e^{-\frac{1}{120}x} dx \\
&=&\left[ – 120e^{-\frac{1}{120}x} \right]_{0}^{+\infty} \\
&=&120
\end{eqnarray}
従って、地震の発生間隔の期待値は \( 120 \) となります。
期待値の線形性
期待値は以下の線形性を満たします。
( \( a,\;b \) は任意の実数、\( X,\;Y \) は確率変数とします。)
$$ E[aX+b]=aE[X]+b $$
$$ E[X+Y]=E[X]+E[Y] $$
分散と標準偏差
分散とは、データのバラツキの程度です。
確率変数 \( X \) の分散は \( Var[X] \) という関数で表記され、以下で定義されます。
$$ Var[X]=E[(X-\mu)^2] $$
上式を展開してみましょう。
\begin{eqnarray}
Var[X]&=&E[(X-\mu)^2] \\
&=&E[X^2-2 \mu X + {\mu}^2] \\
&=&E[X^2] – 2 \mu E[X] + {\mu}^2 \\
&=&E[X^2] – E[X]^2
\end{eqnarray}
以上より、分散 \( Var[X] \) は \( E[X^2] – E[X]^2 \) と表記されることもあります。
また、標準偏差 \( \sigma \) は、以下で定義されます。
$$ \sigma = \sqrt{Var[X]} $$