おさかなメモ

間違っていることを書いているかもしれません.もし間違いを見つけましたらコメントで教えてください!

十分統計量

確率変数 $X=(X_1,\dots,X_n)$ の統計量 $T(X_1,\dots,X_n)$ が,パラメータ $\theta$ に関して $X$ と同じ情報量を持つとき,統計量 $T(X_1,\dots,X_n)$ は十分統計量という.

まず厳密な定義を述べて,なぜその定義が上記の意味を持つのかを説明する.

十分統計量の定義

$k$個の統計量$T(X_1, \dots, X_n)$ がパラメータ $\theta$ に関する$k$ 次元の十分統計量であるとは,$T$ を与えたときの $X=(X_1,\dots,X_n)$ の条件付き分布が $\theta$ に依存しないことである*1

定義の意味

$p(X|T)$ がパラメータに依存しないということは,$X$ を $T$ で条件づけしたときに $\theta$ は $X$ に関係なくなっているということ.無関係になっている.つまり,$X$ と $\theta$ の関係性は $T$ に集約されていると考えて良いので,結局 $\theta$ に関する情報が $T$ に詰まっていて, $X$ を用いて $\theta$ を考えるかわりに,$T$で十分であるから,十分統計量.

*1:竹村彰通. (2020). 現代数理統計学. 学術図書出版社.