TD_ZTestはZ検定を実行します。帰無仮説におけるこの検定統計量の分布は、正規分布で近似できます。
TD_ZTestは、母分散が既知である(まれに真である)という仮定の下で、2つの平均の同等性を検定します。標本が大きい場合、母分散は標本分散で近似されるため、TD_ZTestは検定統計量に母分散ではなく標本分散を使用します。
前提条件
- 標本分布は正規分布になります。
- データはカテゴリではなく、数値です。
検定タイプ
- 片側または両側(選択可)
- 1標本または2標本(選択可)
1標本を使用して、母集団の平均が特定の値より大きいか、小さいか、または等しくないかを検定します。TD_ZTestは、有意水準(α= 0.01、0.05、0.10)における正規分布の臨界値をZ検定統計量と比較することによって答えを見つけます。
- 対応なし
計算方法
- 帰無仮説H0と対立仮説H1
- 1標本検定の場合、無作為標本x1、x2、.... xn
- 2標本検定の場合、2つの無作為標本(x1、x2、.... xnおよびy1、y2、.... yn)
- 検定統計量Zstat
- 有意水準αϵ {0.10, 0.05, 0.01}
- 標本ベースのZstatと正規分布のパーセント点|ᴢ|または|ᴢ α/2|を比較する
- p値を計算する
- Conclusion
1標本Z検定
x1、x2、...xnが、平均µ、分散σ2の母集団から取得した無作為標本であるとします。また、データが正規分布Ɲ (µ, σ2)に従うとします。
H0; µ ≤ µ0
に対して
H1; µ > µ0
または
H0: µ ≥ µ0
に対して
H1: µ < µ0
H0: µ = µ0
に対して
H1: µ ≠ µ0
上記の仮説を検定するための検定統計量はZ-statです。Z-statの有効性は、母分散σ2が既知である場合に成り立ちます。
分散が既知であるという前提は実用的ではありません。分散が既知の場合は平均µも既知になり、テストが不要になるためです。
ただし、(ビッグ データ アプリケーションで一般的なように)標本サイズが大きい場合は、標本分散s 2が未知の分散σ2にほぼ等しくなります。したがって、大きい標本サイズを含むシナリオでは、Z-statisticの適用が有効になります。
Z-statisticは次のように計算されます。
ここで、未知の標準偏差σを、n→∞(標本サイズが非常に大きい)として標本の標準偏差に置き換えます。したがって、Z-statisticは次のように書き換えられます。
2標本Z検定
2標本z検定は、2つの母集団の平均について同等性を検定する場合に使用されます。Ɲ (µ1, )に従うx1、x2、...xn1およびƝ (µ2, )に従うy1、y2、...yn2が、2つの独立した母集団の無作為標本であるとします。この場合、片側(下側)検定の帰無仮説H0と対立仮説H1は、それぞれ次のようになります。
H0; µ 1 ≥ µ2
に対して
H1; µ1 < µ2
Zstat < - ᴢ αの場合、帰無仮説は棄却されます(α ϵ {0.10, 0.05, 0.01})。- ᴢ αは、左側に面積がある正規分布のパーセンタイルであることに注意してください。
片側(上側)検定は次のように計算されます。
H0; µ 1 ≤ µ2
に対して
H1; µ1 > µ2
Zstat > ᴢ αの場合、帰無仮説は棄却されます(α ϵ {0.10, 0.05, 0.01})。ᴢαは、左側に(1- α) x 100の面積がある正規分布のパーセンタイルであることに注意してください。したがって、- ᴢ αの場合、左側の面積は100 x αになります。
H0: µ 1 = µ2
に対して
H1: µ1 ≠ µ2
Zstat > ᴢ 1-α/2またはZstat < -ᴢ α/2の場合、帰無仮説は棄却されます(α ϵ {0.10, 0.05, 0.01})。ᴢ1-α/2は、左側に(1- α/2) x 100の面積がある正規分布のパーセンタイルであることに注意してください。したがって、- ᴢ αの場合、左側の面積は100 x αになります。ZstatはƝ (0,1)に従います。