分布測度、分布関数の理解

概説

$\left(\Omega, \mathcal{F}, \mathbb{P}\right)$を確率空間,$X$を確率変数とする。

思い出してみると、確率測度$\mathbb{P}$の定義は実数値を返す関数で、

  1. $\mathbb{P}(\Omega)=1$
  2. $A_{1}, A_{2}, \cdots\mbox{が互いに素}\ \Longrightarrow\ \mathbb{P}\left(\bigcup_{k=1}^{\infty}A_{k}\right)=\sum_{k=1}^{\infty}\mathbb{P}\left(A_{k}\right)$

で、確率変数$X$の定義は、

写像$X:\Omega\rightarrow\mathbb{R}$で、任意の$A\in\mathcal{B}\left(\mathbb{R}\right)$において
$X^{-1}\left(A\right)\in\mathcal{F}$を満たすもの

であった。
これらを結びつけるものを考えてみる。

分布測度

$\left(\Omega, \mathcal{F}, \mathbb{P}\right)$を確率空間,$X$を確率変数としたとき、
分布測度$\mu_{X}$とは、任意のボレル集合$B\in\mathcal{B}\left(\mathbb{R}\right)$について、
\begin{align*}
    \mu_{X}\left(B\right)=\mathbb{P}\left(X^{-1}\left(B\right)\right)
\end{align*}
を満たす確率測度である。

こいつはいったい何なのか

分布測度$\mu_{X}$というのは、要するに確率空間$\left(\mathbb{R}, \mathcal{B}\left(\mathbb{R}\right), \mu_{X}\right)$を構成するのに必要な確率測度に過ぎない。
でも、好き勝手に作っても意味がなさそうなので、元の確率空間$\left(\Omega, \mathcal{F}, \mathbb{P}\right)$に含まれる$\mathcal{F}$の対応する要素($A=X^{-1}\left(B\right)$)と確率測度の値をそろえておきましょうという風に構成する。

累積分布関数

この分布測度以外にも確率変数の分布を表現する方法がある。
それが累積分布関数と呼ばれるものである。
累積分布関数$F_{X}$とは、$\left(\Omega, \mathcal{F}, \mathbb{P}\right)$を確率空間,$X$を確率変数、この確率変数の分布測度を$\mu_{X}$としたとき、
\begin{align*}
    F_{X}\left(x\right)=\mu_{X}\left((-\infty, x]\right)\quad\left(x\in\mathbb{R}\right)
\end{align*}
を満たす実数値関数である。

分布測度との関係

累積分布関数は分布測度によって定義されているため、あらゆるボレル集合について分布測度の値が判明していれば、累積分布関数を構成できる。
逆に累積分布関数があらゆる実数値について定義されていれば、これは、$a\leq b$について、
\begin{align*}
    F_{X}\left(b\right)-F_{X}\left(a\right)&=\mu_{X}\left((-\infty, b]\right) - \mu_{X}\left((-\infty, a]\right)\\
                                                               &=\left(\mu_{X}\left((-\infty, a]\right) + \mu_{X}\left((a, b]\right)\right) - \mu_{X}\left((-\infty, a]\right)\\
                                                               &=\mu_{X}\left((a, b]\right)
\end{align*}
となる。開区間の計算ができれば、
\begin{align*}
    \left[a, b\right]=\bigcup^{\infty}_{n=1}\left(a-\frac{1}{n}, b\right]
\end{align*}
であることを利用して閉区間の分布測度が構成できる。
さらに、ボレル集合の構成は閉区間からスタートしたことを思い出せば、累積分布関数があらゆる実数値について定義されていることは、分布測度が完全に構成されることを意味する。

こいつの何が嬉しいのか

累積分布関数は入力も出力も実数という点でとても素晴らしい。

「事象の$\sigma$-加法族から実数に移す確率測度」を確率変数というもので「ボレル集合の$\sigma$-加法族から実数に移す分布測度」に変換し、
これの分布測度を考えることで「実数から実数に移す累積分布関数」に変換できたのである。

つまり事象を「実数の集合(ボレル集合)」と「実数から実数に移す関数」というなじみあるもので特徴づけることできるのである。
くどいようだが、「実数から実数に移す関数(=累積分布関数)」から「ボレル集合の$\sigma$-加法族から実数に移す分布測度」が構成できて、そして「ボレル集合の$\sigma$-加法族から実数に移す分布測度」は、もともと扱っていた事象の確率測度と対応している。
しかも、ボレル集合という側面から対応付けがしにくい「事象の$\sigma$-加法族」の要素は適当に扱っておけばいい(空集合を割り当てるなど)のであった。

この記事へのコメント