データの要約

確率変数

ある確率をともなって観測される、計測可能な数値の集合です。
例えば、サイコロを振って出る目を考えてみましょう。
歪みのないサイコロであれば、どの目も\( 1/6 \)の確率で出ます。
\( 1/6 \)という確率をともなって、計測可能なサイコロの出る目 \( 1,\cdots,6 \) が観測されます。
このとき、確率変数 \( X \) は以下のように表現されます。

$$ X = \{ 1,2,\cdots,6 \} $$

ここで、 集合 \( X \) の要素は事象 \( x \)と呼ばれ、以下のように表現されます。

$$ x \in X $$

期待値

確率変数 \( X \) に対して、期待値は \( E[X] \) という関数で表記されます。(Eはexpendの略です。)
以下、確率変数 \( X \) が離散型変数と連続型変数の場合に分けてご紹介します。

離散型変数の場合

サイコロの目やコインの表裏など、離散型の値が確率変数となる場合を考えます。
ある事象 \( x \) が起こる確率を \( P[X=x] \) とすると、期待値 \( E[X] \) は以下で定義されます。

$$ E[X]=\sum_{x \in {X}} xP[X=x] $$

例としてサイコロの出る目の期待値を計算しましょう。
確率変数 \( X \) は、以下となります。

$$ X = \{ 1,2,\cdots,6 \} $$

次に、各事象が起こる確率は以下となります。

$$ P[X=1]=P[X=2]=\cdots=P[X=6]=\frac{1}{6} $$

これより、期待値 \( E[X] \) を算出します。

\begin{eqnarray}
E[X]&=&\sum_{x \in {X}} xP[X=x] \\
&=&1 \times \frac{1}{6} + 2 \times \frac{1}{6} + \cdots 6 \times \frac{1}{6} \\
&=&3.5
\end{eqnarray}

従って、サイコロの出る目の期待値は \( 3.5 \) となります。

連続型変数の場合

地震の発生間隔や電池の寿命など、連続型の値が確率変数となる場合を考えます。
ある事象 \( x \) が起こる確率を \( f(x) \) とすると、期待値 \( E[X] \) は以下で定義されます。

$$ E[X]=\int_{x \in {X}} xf(x)dx $$

例としての地震の発生間隔の期待値を計算しましょう。
確率変数 \( X \) を発生間隔とすると、以下となります。

$$ X := (0,\;+\infty ) $$

次に、事象 \( x \in X \) が起こる確率は以下となります。

$$ f(x) = \frac{1}{120}e^{-\frac{1}{120}x} $$

この \( f(x) \) は確率密度関数と呼ばれます。

これより、期待値 \( E[X] \) を算出します。

\begin{eqnarray}
E[X]&=&\int_{x \in {X}} xf(x)dx \\
&=&\int_{0}^{+\infty} x \cdot \frac{1}{120}e^{-\frac{1}{120}x} dx \\
&=&\frac{1}{120} \int_{0}^{+\infty} x e^{-\frac{1}{120}x} dx \\
&=&\frac{1}{120} \cdot (-120) \left\{ \left[ x e^{-\frac{1}{120}x} \right]_{0}^{+\infty} – \int_{0}^{+\infty} e^{-\frac{1}{120}x} dx \right\} \\
&=&\int_{0}^{+\infty} e^{-\frac{1}{120}x} dx \\
&=&\left[ – 120e^{-\frac{1}{120}x} \right]_{0}^{+\infty} \\
&=&120
\end{eqnarray}

従って、地震の発生間隔の期待値は \( 120 \) となります。

期待値の線形性

期待値は以下の線形性を満たします。
( \( a,\;b \) は任意の実数、\( X,\;Y \) は確率変数とします。)

$$ E[aX+b]=aE[X]+b $$

$$ E[X+Y]=E[X]+E[Y] $$

分散と標準偏差

分散とは、データのバラツキの程度です。
確率変数 \( X \) の分散は \( Var[X] \) という関数で表記され、以下で定義されます。

$$ Var[X]=E[(X-\mu)^2] $$

上式を展開してみましょう。

\begin{eqnarray}
Var[X]&=&E[(X-\mu)^2] \\
&=&E[X^2-2 \mu X + {\mu}^2] \\
&=&E[X^2] – 2 \mu E[X] + {\mu}^2 \\
&=&E[X^2] – E[X]^2
\end{eqnarray}

以上より、分散 \( Var[X] \) は \( E[X^2] – E[X]^2 \) と表記されることもあります。

また、標準偏差 \( \sigma \) は、以下で定義されます。

$$ \sigma = \sqrt{Var[X]} $$