2016-01-24

n次の推移行列

確率論

準備

確率過程の主要な問題の1つとして、現在の状態の分布から未来の状態を計算する、というものがある。マルコフ連鎖を用いることで、この確率を求めることが可能である。

$\{X_n\}$ がマルコフ連鎖、 $i_0,i_1,\ldots,i_n \in S$ の時
マルコフ連鎖の定義、推移行列 $p_{i,j}$ の定義より

(1)
${ \begin{eqnarray} & & P(X_0=i_0,X_1=i_1,\ldots,X_n=i_n) \\ & = & P(X_0=i_0,\ldots,X_{n-1}=i_{n-1})\cdot \frac{P(X_0=i_0,X_1=i_1,\ldots,X_n=i_n)}{P(X_0=i_0,X_1=i_1,\ldots,X_{n-1}=i_{n-1})} \\ & = & P(X_0=i_0,\ldots,X_{n-1}=i_{n-1})\cdot P(X_n=i_n\;|X_0=i_0,\ldots,X_{n-1}=i_{n-1}) \\ & = & P(X_0=i_0,\ldots,X_{n-1}=i_{n-1})\cdot p_{i_{n-1},i_n} \\ & = & \ldots \\ & = & P(X_0=i_0)\cdot p_{i_0,i_1}\cdot p_{i_1,i_2}\cdot \ldots \cdot p_{i_{n-1},i_n} \end{eqnarray} }$
が成り立つ。(1)式より、マルコフ連鎖は $X_0$ 分布(初期分布)と推移行列 $\{p_{i,j}\}$ により定まることが分かる。

※マルコフ連鎖(上)推移行列(下)[確認]
${ {\small \begin{equation} P(X_{n+1} = j \; | X_0=j_0,X_1=j_1,\ldots,X_{n-1}=j_{n-1},X_n=i)=P(X_{n+1}=j\;|X_n=i) \\ p_{i,j} = P(X_{n+1}=j|X_n=i) \;\;\; (i,j \in S) \end{equation}} }$

定義

$p_{i,j^{(n)}}=P(X_n=j|X_0=i)$ を $n$ 次の推移確率 $p_{i,j^{(n)}}$ を要素とする行列、

${ \begin{equation} P^{(n)}=\{p_{i,j}^{(n)}\}_{i,j \in S} \end{equation} }$

をn次の推移行列という。

マルコフ連鎖の式は $n,m > 0$ に対して
${ \begin{equation} P(X_0=i_0,X_1=i_1,\ldots,X_{n+m}=i_{n+m}) = P(X_0=i_0)\cdot p_{i_0,i_1}\cdot p_{i_1,i_2}\cdot \ldots \cdot p_{i_{n-1},i_n} \end{equation} }$
である。この両辺を $i_0,i_n,i_{n+m}$ を除いた全ての $i_j$ について和を取ると

${ \begin{eqnarray} & & P(X_0=i_0,X_n=i_n,X_{n+m}=i_{n+m}) \\ & = & \sum_{i_i,\ldots,i_{n-1}} P(X_0=i_0)p_{i_0,i_1}\ldots p_{i_{n-1},i_n} \sum_{i_{n+1},\ldots,i_{n+m-1}} p_{i_n,i_{n+1}}\ldots p_{i_{n+m-1},i_{n+m}} \\ & = & P(X_0=i_0,X_{n}=i_n)P(X_{n+m}=i_{n+m} | X_n=i_n) \end{eqnarray} }$

である。ここで両辺を $P(X_0=i_0,X_n=i_n)$ で割ると

${ \begin{equation} P(X_{n+m}=i_{n+m} | X_0=i_0,X_n=i_n) = P(X_{n+m}=i_{n+m} | X_n=i_n) \end{equation} }$

を得る。これはマルコフ連鎖の式の別表現である。

補題 (チャップマン・コルモゴロフの公式)

任意の整数 $m,n \ge 0$ と $i,j \in S$ に対して
${ \begin{equation} p_{i,j}^{(n+m)}=\sum_{k \in S} p_{i,k}^{(n)} p_{k,j}^{(m)} \;\;\;\;\; (※) \end{equation} }$
が成り立つ。

証明

$\cup_{k\in S} \{X_n=k\}=\Omega$ であるから
${ \begin{eqnarray} p_{i,j}^{(n+m)} & = & P(X_{n+m}=j|X_0=i) \\ & = & \sum_{k\in S} P(X_{n+m}=j,X_n=i_k|X_0=i) \\ & = & \sum_{k\in S} P(X_{n+m}=j|X_n=k,X_0=i)P(X_n=k|X_0=i) \\ & = & \sum_{k\in S} P(X_{x+m}=j|X_n=k)P(X_n=k|X_0=i) \\ & = & \sum_{k\in S} p_{k,j}^{(m)}p_{i,k}^{(n)} \\ & = & \sum_{k\in S} p_{i,k}^{(n)}p_{k,j}^{(m)} \;\;\;\; \Box \end{eqnarray} }$

同じ状態空間 $S$ より定義された2つの推移行列 $P=\{p_{i,j}\},Q=\{q_{i,j}\}$ の積 $PQ$ を通常の行列の積と同様に

${ \begin{equation} PQの(i,j)要素=\sum_{k\in S} p_{i,k}q_{k,j} \end{equation} }$

により定義する。そうすると(※)を

${ \begin{equation} P^{(n+m)}=P^{(n)}P^{(m)} \end{equation} }$

と表すことができ、更に

${ \begin{equation} P^{(n)}=P^{(n-1)}P=\ldots=P^n \end{equation} }$

よりn次の推移行列は推移行列のn回の積であることが分かる。

参考書籍

宮沢政清(2013)『確率と確率過程』(現代数学ゼミナール17)近代科学社

2016-01-23

離散時間型マルコフ連鎖

確率論

マルコフ連鎖

$P$ を確率測度とし、 $\{X_n\}_{n=1}^{\infty}$ を有限または可算の集合 $S$ を状態空間に持つ離散形確率過程とする。

※確率過程(Wikipedia参照)

確率論において、確率過程（かくりつかてい、英語: stochastic process）は、時間とともに変化する確率変数のことであり、株価や為替の変動、ブラウン運動などの粒子のランダムな運動を数学的に記述するモデルとして利用される。不規則過程（英語: random process）とも言う

確率過程(Wikipedia)

※状態空間・・・確率過程が各時刻で取る値の集合

定義

$\{X_n\}_{n=0}^{+\infty}$ が任意の $n$ と任意の $j_0,j_1,\ldots,j_{n-1},i,j \in S$ に対して、

${ \begin{equation} (1) \;\; P(X_{n+1} = j \; | X_0=j_0,X_1=j_1,\ldots,X_{n-1}=j_{n-1},X_n=i)=P(X_{n+1}=j\;|X_n=i) \end{equation} }$

を満たすとき、 $\{X_n\}$ を離散時間型マルコフ連鎖または単にマルコフ連鎖と呼ぶ。更に上式の右辺が $n$ に依存しないならば、定常な推移を持つという。また(1)式は次のように表すこともできる。

${ \begin{equation} (1)' \;\; P(X_{n+1} = j \; | X_0,X_1,\ldots,X_n) = P(X_{n+1} = j | X_n) \end{equation} }$

これらの式は次の時刻における状態は、現在の状態によってのみ決まり、過去によらないことを示している。このことをマルコフ性と呼ぶ。マルコフ連鎖が定常な推移を持つならば、状態の変化は出発点の時刻に依存しない。

定常な推移について言い換え

マルコフ連鎖が定常な推移を持つとは $i,j \in S$ に対して
${ \begin{equation} p_{i,j}=P(X_{n+1} = j \; | X_n = i ) \end{equation} }$
を満たす $p_{i,j}$ が存在するとき。 $\{X_n\}$
は定常な推移を持つという。

マルコフ連鎖の例

状態空間 $S = \{A,B,C\}$
を用意します。1秒ごとにAからBへ1/3の確率で、AからCへ1/3の確率で、
AからAに1/3,BからBに1/3,BからAに2/3,CからBに1/3,CからCに2/3の
確率で状態がうつるとする。この時推移図は以下のようになっている。

f:id:doratai:20160123202419p:plain

この時、推移行列は次で与えられる。
${ P = \left( \begin{array}{ccc} 1/3 & 1/3 & 1/3 \\ 2/3 & 1/3 & 0 \\ 0 & 1/3 & 2/3 \end{array} \right) }$
大学受験で確率をやった人は上のような図を書いたことがある人もいると思います。
この確率過程は $n$ の値によっていないことがわかります。
例えば時間 $n$ の時に状態Bであった時、次の時間 $n+1$ の時に状態A
である確率は次のようにかけます。
${ \begin{equation} P(X_{n+1} = A\;| X_n = B ) = \frac{2}{3}\cdot P(X_n=B) \end{equation} }$
次の状態は現在の状態にのみ依存していることがわかりますね。
故にこの確率過程はマルコフ性を持っています。また、
BからAに推移する確率は $n$ の値に関わらず 2/3 です。他の場合も同様であり
これは「定常な推移を持つ」と言えます。

※推移行列の見方はAを状態1,Bを状態2,Cを状態3としたとき、状態1から状態2に推移する確率が1行2列目の $p_{1,2}$ 成分に書かれている。

推移行列に関する補足

先に例示した推移行列 $P$ の各行を見てもらいたい。各行の成分を横に足してくと和が1になっているのが分かる。
$n$ 次の正方行列 $Q=\{q_{i,j}\}$ がマルコフ連鎖の推移行列になるための必要十分条件として

${ \begin{equation} q_{i,j} \ge 0, \;\;\;\; \sum_{j\in S} q_{i,j} = 1 \end{equation} }$

があることを覚えておきたい。

参考書籍

宮沢政清(2013)『確率と確率過程』(現代数学ゼミナール17)近代科学社

2016-01-21

平均μ、分散σ^2共に未知の場合の尤度比検定(正規分布)

統計学

この検定方法の導出がなかなかに骨が折れるものでした...
定着のためにも載せておこうと思います。

尤度比検定

ここで用いる尤度比検定の基本的な内容については以下を参照してください
doratai.hatenablog.com尤度比検定 - 統計,確率のお勉強

問題

正規母集団の平均に関する検定において、母分散 $\sigma^2$ を未知としたとき、以下の検定問題

\begin{eqnarray}
\left\{
\begin{array}{l}
H_0 : \mu = \mu_0 \\
H_1 : \mu \neq \mu_0
\end{array}
\right.
\end{eqnarray}
の検定方法を導く。

導出

ともに未知の平均と分散 $\mu,\sigma^2$ の正規母集団からの互いに独立した標本を $X_1,X_2,\ldots,X_n$ とし、有意水準は $\alpha$ とする。
正規母集団 $N(\mu,\sigma^2)$ にしたがっているので、母集団の分布は

$f(x;\mu, \sigma^2) = \frac{1}{\sqrt{2 \pi}\sigma} \exp(-\frac{(x - \mu)^2}{2\sigma^2})$

で与えられる。尤度比を $\lambda$ とすると、
${ \begin{eqnarray} \lambda & = & \frac{\max_{\sigma^2} \prod_{i=1}^n \frac{1}{\sqrt{2\pi}\sigma}\exp(-\frac{(x_i-\mu_0)^2}{2\sigma^2})}{\max_{\mu,\sigma^2} \prod_{i=1}^n \frac{1}{\sqrt{2\pi}\sigma} \exp(-\frac{(x_i-\mu)^2}{2\sigma^2}) } \\ & = & \frac{\{ (\frac{1}{2\pi \hat{\sigma}_0^2})^{\frac{n}{2}} \exp(-\frac{1}{2\hat{\sigma}_0^2} \sum_{i=1}^n (x_i - \mu_0)^2) \}_{\hat{\sigma}_0^2 = \frac{1}{n}\sum_{i=1}^n (x_i - \mu_0)^2}}{\{ (\frac{1}{2\pi \hat{\sigma}_1^2})^{\frac{n}{2}} \exp(-\frac{1}{2\hat{\sigma}_1^2} \sum_{i=1}^n (x_i - \bar{x})^2) \}_{\hat{\sigma}_1^2 = \frac{1}{n}\sum_{i=1}^n (x_i - \bar{x})^2}} \\ & = & ( \frac{\hat{\sigma}_1^2}{\hat{\sigma}_0^2})^{\frac{n}{2}} \\ & = & ( \frac{\sum_{i=1}^n (x_i - \bar{x})^2}{\sum_{i=1}^n (x_i-\mu_0)^2} )^{\frac{n}{2}} \\ & = & (\frac{\sum_{i=1}^n (x_i - \bar{x})^2}{\sum_{i=1}^n (x_i - \bar{x} + \bar{x} - \mu_0)^2})^{\frac{n}{2}} \\ & = & (\frac{\sum (x_i - \bar{x})^2}{\sum (x_i-\bar{x})^2 + n(\bar{x}-\mu_0)^2})^{\frac{n}{2}} \\ & = & (\frac{1}{1+ \frac{(\bar{x}-\mu_0)^2}{\frac{1}{n}\sum (x_i - \bar{x})^2}})^{\frac{n}{2}} \\ \end{eqnarray} }$

ここで、 $t^2 = (\frac{\bar{x}-\mu_0}{s/\sqrt{n-1}})^2, s^2 = \frac{1}{n} \sum_{i=1}^n (x_i-\bar{x})^2$ として

${ \begin{eqnarray} \lambda & = & (\frac{1}{1+(\frac{\bar{x}-\mu_0}{s/\sqrt{n-1}}\cdot \frac{1}{\sqrt{n-1}})^2})^{\frac{n}{2}} \\ & = & (\frac{1}{1+\frac{t^2}{n-1}})^{\frac{n}{2}} \end{eqnarray} }$

となる。よって棄却域 $W^*$ は

${ \begin{eqnarray} W^* & = & \{ (X_1,\ldots,X_n) ; \lambda < k \} \\ & = & \{ (X_1,\ldots,X_n); (\frac{1}{1+\frac{t^2}{n-1}})^{\frac{n}{2}} < k \} \\ & = & \{ (X_1,\ldots,X_n); 1+\frac{t^2}{n-1} > k^{-\frac{2}{n}}\} \\ & = & \{ (X_1,\ldots,X_n); |t| > \sqrt{(k^{-\frac{2}{n}}-1)(n-1)} = c \} \end{eqnarray} }$

で与えられる。ここで $c$ は

$P((X_1,\ldots,X_n) \in W^* | \mu = \mu_0) = \alpha$

$P(|T| > c | \mu = \mu_0) = \alpha$

によって定められ $H_0$ のもとで $T=\frac{\bar{X}-\mu_0}{S/\sqrt{n-1}}$ は自由度 $n-1$ の $t$ 分布に従う。
よって

$P(|T| = \frac{|\bar{X}-\mu_0|}{S/\sqrt{n-1}} > t_{n-1} (\alpha/2) ) = \alpha$

より $c = t_{n-1} (\alpha/2)$ 　とすれば良いことが分かる。
以上より棄却域は

$W^* = \{(X_1,\ldots,X_n); \frac{|\bar{X}-\mu_0|}{S/\sqrt{n-1}} > t_{n-1} (\alpha/2) \}$

で与えられる。

参考文献

鈴木武・山田作太郎(2006)『数理統計学-基礎から学ぶデータ解析-』内田老鶴圃.
国沢清典(2012)『確率統計演習2-統計』培風館.

2016-01-20

一様最強力検定(UMP検定)

統計学

定義

互いに独立な標本 $X_1,X_2,\ldots,X_n$ に対して
検定問題
\begin{eqnarray}
\left\{
\begin{array}{l}
H_0 : \theta \in \Theta_0 \\
H_1 : \theta \in \Theta_1
\end{array}
\right.
\end{eqnarray}
を考えたとき、最良な棄却域 $W^*$ の選び方として
\begin{equation}
\forall \theta_0 \in \Theta_0,\beta_{W^*} (\theta_0) = P((X_1,\ldots,X_n) \in W^* | \theta_0 \in \Theta_0) = \alpha
\end{equation}
かつ
\begin{equation}
\forall W, \forall \theta_1 \in \Theta_1,\beta_{W^*} (\theta_1) \ge \beta_W (\theta_1)
\end{equation}
を満たす一様最強力棄却域 $W^*$ によって定まる検定を一様最強力検定という。

内容

※覚えておきたいこと
検定を決める = 棄却域を決める

何を言っているのかというと、どのような棄却域よりも、検出力が大きい。
つまり、検出力が最大となるような棄却域(一様最強力棄却域)を用いて行われる検定が
他の棄却域を用いる検定に比べ最も良いということが言いたいのである。
最初のやつは有意水準に関する言及であり、メインは後者の方である。後者の式を言い直すと、

「任意のどのような棄却域をとってきたとしても、その検出力は、最強力棄却域による検出力以下である」

ということである。

また、後者の式を変形すると

\begin{eqnarray}
\beta_{W^*} (\theta_1) & \ge & \beta_W (\theta_1) \\
P((X_1,\ldots,X_n) \in W^* | \theta_1 \in \Theta_1) & \ge & P((X_1,\ldots,X_n) \in W | \theta_1 \in \Theta_1) \\
1-P((X_1,\ldots,X_n) \notin W^* | \theta_1 \in \Theta_1) & \ge & 1-P((X_1,\ldots,X_n) \notin W | \theta_1 \in \Theta_1) \\
P((X_1,\ldots,X_n) \notin W^* | \theta_1 \in \Theta_1) & \le & P((X_1,\ldots,X_n) \notin W | \theta_1 \in \Theta_1)
\end{eqnarray}

これはつまり、一様最強力棄却域が、第2種の誤り確率を最小にする棄却域であることを示している。

参考文献

鈴木武・山田作太郎(2006)『数理統計学-基礎から学ぶデータ解析-』内田老鶴圃.
国沢清典(2012)『確率統計演習2-統計』培風館.
稲垣宣生(2013)『数理統計学』(数学シリーズ)裳華房.

2016-01-19

検出力関数

統計学

第1種の誤りと第2種の誤り

検定で必ず出てくる第1種の誤りと第2種の誤りについて確認する。

第1種の誤り・・・帰無仮説 $H_0$ が正しいにも関わらず、 $H_0$ を棄却してしまう誤り

第2種の誤り・・・対立仮説 $H_1$ が正しいにも関わらず、 $H_0$ を採択してしまう誤り
となる。
通常、第1種の誤りよりも第2種の誤りの方が重大である。

検出力関数の定義

統計の参考書を読んでいると、数理統計学を扱う参考書ですら、
検出力という単語はでるものの、検出力関数という単語があまり出てこない。
(これを書いている時、私もそれで困っている。)
私が持っている参考書によると

検定関数を $\varphi(\boldsymbol{X})$ として

\begin{eqnarray}
\left\{
\begin{array}{l}
H_0 : \theta \in \Theta_0 \\
H_1 : \theta \in \Theta_1
\end{array}
\right.
\end{eqnarray}
の検定問題を考えた時、対立仮説が正しい時に
\begin{equation}
\beta (\theta; \varphi) := E_{\theta} (\varphi (\boldsymbol{X})) \;\; (\theta \in \Theta_1)
\end{equation}
は $H_1$ を受容する確率を表している。
つまりは検定 $\varphi (\boldsymbol{X})$ の良さを表しており、
これを $\varphi(\boldsymbol{X})$ の検出力という。
$\beta (\theta; \varphi)$ を $\theta$ の関数と見たとき、 $\beta$ を $\varphi(\boldsymbol{X})$ の検出力関数と呼ぶ。

授業を受けたのでそれによると

検出力関数(power function)・・・棄却域 $W$ を与えて、帰無仮説 $H_0$ を棄却(reject)する確率
で与えられ、

\begin{equation}
\beta_W(\theta) = P((X_1,\ldots,X_n) \in W | \theta \in \Theta)
\end{equation}

で定義される。

1.特に $\theta_1 \in \Theta_1$ の時、 $\beta_W(\theta_1)$ を検出力(power)という

\begin{equation}
\beta_W(\theta_1) = P((X_1,\ldots,X_n) \in W | \theta_1 \in \Theta_1) \;\; \gets (大きいほうがよい) \\
= 1 - P((X_1,\ldots,X_n) \notin W | \theta_1 \in \Theta_1)\; \gets (第2種の誤り)
\end{equation}

2.特に $\theta \in \Theta$ の時

\begin{equation}
\beta_W(\theta_0) = P((X_1,\ldots,X_n) \in W | \theta_0 \in \Theta_0) \;\; \gets (第1種の誤り)
\end{equation}

参考文献

2016-01-14

尤度比検定

統計学

尤度関数(likelihood function)

尤度とは尤もらしさ（もっともらしさ）の度合いのことを指している。

とりあえずこれだけ

母集団の分布を $f(x;\theta)$ とするとき、母数 $\theta$ に関する尤度関数 $L(\theta)$ は
\begin{equation}
L(\theta) = \prod_{i=1}^n f(x_i;\theta)
\end{equation}
と書ける

もう少し説明を...

$X_1,X_2,\ldots,X_n$ の同時確率(密度)関数を $f(x_1,x_2,\ldots,x_n; \theta)$ とする。
実現値 $X_1=x_1,X_2=x_2,\ldots,X_n=x_n$ に対して、 $f(x_1,x_2,\ldots,x_n; \theta)$ は
$X_1=x_1,X_2=x_2,\ldots,X_n=x_n$ が観測される確率または確率密度であって、未知パラメータ $\theta$ に依存する。

※実現値、つまり、観測された値を代入することで変数は $\theta$ のみとなる。

先の関数 $f(x_1,x_2,\ldots,x_n)$ において、 $x_1,x_2,\ldots,x_n$ を固定すると、
変数 $\theta$ の関数と考えることができる。この関数のことを尤度関数といい、
パラメータ $\theta$ が持っている、観測値 $(x_1,x_2,\ldots,x_n)$ を実現させる尤もらしさを表している。

尤度関数は
\begin{equation}
L(\theta ; x_1,x_2,\ldots,x_n) = L(\theta) = \prod_{i=1}^n f(x_i;\theta)
\end{equation}
と表す。また、通常は尤度関数の対数を取った対数尤度関数(最後の等号は $X_1,X_2,\ldots,X_n$ が独立かつ同一分布に従うとき)
\begin{equation}
l(\theta) = \log L(\theta) = \log \prod_{i=1}^n f(x_i;\theta) = \sum_{i=1}^n \log f(x_i;\theta)
\end{equation}
を用いて、対数尤度関数を最大にする $\hat{\theta}(x_1,x_2,\ldots,x_n)$ を求める。

尤度比検定法

尤度についての確認が取れたところで、本題の尤度比検定にうつる。

確率ベクトル $\boldsymbol{X} = (X_1,X_2,\ldots,X_n)$ の確率(密度)関数を $f(x_1,x_2,\ldots,x_n), \theta \in \Theta$
とする。 $\Theta_0 (\neq \phi) \in \Theta, \Theta_1 = \Theta - \Theta_0 (\neq \phi)$ に対し、仮説検定問題
\begin{eqnarray}
\left\{
\begin{array}{l}
H_0 : \theta \in \Theta_0 \\
H_1 : \theta \in \Theta_1
\end{array}
\right.
\end{eqnarray}
について考える。固定された各標本 $\boldsymbol{x} = (x_1,x_2,\ldots,x_n)$ 対し
\begin{equation}
\lambda(\boldsymbol{x}) := \frac{\sup_{\theta \in \Theta_0} f(x_1,\ldots,x_n;\theta)}{\sup_{\theta \in \Theta} f(x_1,\ldots,x_n;\theta)}
\end{equation}
を求め、適当に定められた定数 $c$ に対し、
\begin{equation}
\lambda(\boldsymbol{x}) < c
\end{equation}
となるとき $H_0$ を棄却し、そうでないときは採択するという検定方式を考える。
この時定数 $c$ は以下の式で与えられる。( $\alpha$ は有意水準)
\begin{equation}
\sup_{\theta \in \Theta_0} P(\lambda(\boldsymbol{x}) < c | \theta \in \Theta_0) = \alpha
\end{equation}
以上のような検定方式を水準 $\alpha$ の尤度比検定と呼び、統計量 $\lambda(\boldsymbol{x})$ を尤度比と呼ぶ。

実際に使う時の流れ

(1)尤度比 $\lambda$ を求め、棄却域 $R_c$ を
\begin{equation}
R_c = \{(x_1,\ldots,x_n);\lambda = \frac{\prod_{i=1}^n f(x_i;\theta_0)}{\max_{\theta \neq \theta_0} \prod_{i=1}^n f(x_i;\theta)} \le c\}
\end{equation}
によって定める。

(2)次に $c_0$ を適当に定め、 $R_{c_0}$ として
\begin{equation}
P((X_1,\ldots,X_n) \in R_{c_0} | \theta = \theta_0) = \int \ldots \int_{R_{c_0}} \prod_{i=1}^n f(x_i;\theta_0)dx_1 \ldots dx_n = \alpha
\end{equation}
が成立するようにすれば、この $R_{c_0}$ が棄却域(有意水準 $\alpha$ )となる。

以上(1)(2)を行えば尤度比検定法を導くことができる。ここで、は上限 $\sup$ ではなく最大値 $\max$ が使われているが、上限が使われているのは
理論の厳密にするためであり、実用上は最大値を用いればよいからである。

尤度比検定法を用いる具体的な例は少し長くなるし、疲れたのでまた今度にする。

参考文献

2016-01-13

Neyman-Pearson(ネイマン・ピアソン)の基本定理

統計学

一般

確率ベクトル(標本確率変数) $\boldsymbol{X} = (X_1,X_2,\ldots,X_n)$ は分布 $P_{\theta}, \theta \in \Theta$ に従うとし、
分布 $P_\theta$ の確率(密度)関数を $f(\boldsymbol{x};\theta) (= \prod_{i=1}^n f(x_i;\theta))$ とする。
この時、検定問題

\begin{eqnarray}
\left\{
\begin{array}{l}
H_0 : \theta = \theta_0 (単純仮説) \\
H_1 : \theta = \theta_1 (単純仮説)
\end{array}
\right.
\end{eqnarray}

に対する有意水準 $\alpha(0\le \alpha \le 1)$ の最強力検定 $\varphi_0(\boldsymbol{x})$ は次式で与えられる。
(※ $\varphi(\boldsymbol{x})$ のことを検定関数という)

\begin{eqnarray}
\varphi_0(\boldsymbol{x}) =
\left\{
\begin{array}{ll}
1 & if \;\; f(\boldsymbol{x};\theta_1) > kf(\boldsymbol{x};\theta_0) \\
\gamma & if \;\; f(\boldsymbol{x};\theta_1) = kf(\boldsymbol{x};\theta_0) \\
0 & if \;\; f(\boldsymbol{x};\theta_1) < kf(\boldsymbol{x};\theta_0)
\end{array}
\right.
\end{eqnarray}

ここで、定数 $\gamma(0 \le \gamma \le 1), k (\ge 0)$ は次式から定まるものである。
\begin{equation}
E_{\theta_0} ( \varphi(\boldsymbol{X}) ) = \alpha
\end{equation}

以上がNeyman-Pearsonの基本定理である。これだけではなんのことかわからないので、もう少しわかりやすく書いていくことにする。

つまりは...

大きさnの無作為に抽出された独立な標本 $X_1,X_2,\ldots,X_n$ について、帰無仮説、対立仮説共に単純仮説である検定問題

\begin{eqnarray}
\left\{
\begin{array}{l}
H_0 : \theta = \theta_0 (単純仮説) \\
H_1 : \theta = \theta_1 (単純仮説)
\end{array}
\right.
\end{eqnarray}

に対して、最強力棄却域 $R^*$ はが以下で与えられる。

\begin{equation}
R^* = \{ (X_1,X_2,\ldots,X_n) ; \frac{\prod_{i=1}^n f(x_i;\theta_1)}{\prod_{i=1}^n f(x_i;\theta_0)} > c \} , c>0
\end{equation}

ただしこの時、 $c$ は以下により決まる( $\alpha$ は有意水準)

\begin{eqnarray}
P((X_1,X_2,\ldots,X_n) \in R^* | \theta = \theta_0) & = & P(第1種の誤りがおこる) \\
& = & \int \ldots \int_{R^*} \prod_{i=1}^n f(x_i;\theta_0)dx_1 \ldots dx_n \\
& = & \alpha
\end{eqnarray}

上記二つを行うことで最強力棄却域が求まることを、Neyman-Pearsonの基本定理は言っているのである。
この最強力棄却域の基づく検定のことを最強力検定と呼び、Neyman-Pearsonの基本定理を用いることで、
帰無仮説、対立仮説がともに単純仮説の際、最強力検定を求めることができるのである。

以下のことを覚えておきたい。
検定関数 $\varphi(\boldsymbol{x})$ を決める $\Leftrightarrow$ 棄却域 $R$ を決める

対立仮説が複合の場合でも活躍するNeyman-Pearonの定理

Neyman-Pearsonの定理は基本単純仮説同士の検定に用いられるが、対立仮説が以下のような場合にも応用することができる。
帰無仮説 $H_0 : \mu = \mu_0$
対立仮説 $H_1 : \mu > \mu_0 または \mu < \mu_0$
このような対立仮説の検定問題の場合、 $\mu > \mu_0(または \mu < \mu_0)$ を満たすような任意の $\mu_1$ を用いて
単純仮説に帰着することで、Neyman-Pearsonの基本定理を応用することができる。

参考文献

2016-01-10

検定方式の定め方[正規分布の例]

統計学

統計を各分野で応用する場合、既に知られている検定方式をただ使うことがほとんどであり、その検定方式がどのようにして定まるのか触れられることは少なく、また、それを知る必要性も低い。しかし、統計学をきちんと学ぼうとする際に各手法がどのような理論のもとで成り立っているのかを知ることは、各手法がどのような考え方のもとできてきているのか、統計がどのような考え方を持って各手法を導き出しているのかを知る助けとなる。ここでは、Neyman-Pearsonの定理から、検定方式を定め方に関して、式を追っていくことにする。

※環境によっては分数やルートの横棒が表示されないことがあります。

Neyman-Pearson(ネイマン・ピアソン)の定理

帰無仮説 $H_0 : \theta = \theta_0$ (単純仮説)
対立仮説 $H_1 : \theta = \theta_1$ (単純仮説)

に対して検定する。標本数は $n$ である。

棄却域が決まれば検定方式が決まる。最強力検定法をを作るにはNeyman-Pearsonの定理から以下の手順に従えば良いことがわかっている。

(1)領域を作る。

$Rc = \{(x_1,x_2,...,x_n); \frac{\prod_{i=1}^n f(x_i; \theta_1)}{\prod_{i=1}^n f(x_i; \theta_0)} \ge c\}$

となる領域 $R_c$ を作っておく。

(2)
$P\{(X_1,X_2,...,X_n) \in R_c | \theta = \theta_0 \} = P(第1種の誤りが起こる)$

$= \int \ldots \int_{R_c} \prod_{i=1}^n f(x_i;\theta_0)dx_1\ldots dx_n = \alpha$

となるように定数 $c$ を定める。この時求まった $R_c$ が最強力棄却域 $R^*$ となる。

以上の(1)(2)従って検定方式を求めていく。例として正規母集団に関する検定方式を求めていく。

検定方式を求める(正規母集団,平均 $\mu$ 未知,分散 $\sigma^2$ 既知)

正規母集団 $N(\mu,\sigma^2)$ の母平均 $\mu$ について下記の仮説の時

帰無仮説 $H_0 : \mu = \mu_0$
対立仮説 $H_1 : \mu = \mu_1 (> \mu_0)$

次の検定法が最強力検定法であることを示す。

$\bar{x} < \mu_0 + u(\alpha) \frac{\sigma}{\sqrt{n}}$ 　の時 $H_0$ を棄却

$\bar{x} > \mu_0 + u(\alpha) \frac{\sigma}{\sqrt{n}}$ 　の時 $H_0$ を採択

( $\alpha$ は有意水準,u( $\alpha$ )は標準正規分布の上側確率)

ここでは正規母集団 $N(\mu,\sigma^2)$ を考えているので母集団の分布は

${ f(x;\mu) = \frac{1}{\sqrt{2\pi}\sigma}\exp\{-\frac{(x-\mu)^2}{2\sigma^2} \}}$

で与えられ、これを(1)の式に代入する。

(a)
$Rc = \{(x_1,\ldots,x_n); \frac{\prod_{i=1}^n\frac{1}{\sqrt{2\pi}\sigma}\exp\{-\frac{(x-\mu_1)^2}{2\sigma^2} \}}{\prod_{i=1}^n\frac{1}{\sqrt{2\pi}\sigma}\exp\{-\frac{(x-\mu_0)^2}{2\sigma^2} \}} \ge c \}$