TD_ChiSq - Advanced SQL Engine

TD_ChiSq - Advanced SQL Engine - Teradata Database

Teradata Vantage™ - Advanced SQL Engine分析関数

Product

Advanced SQL Engine

Teradata Database

Release Number

17.10

Published

2021年7月

Language

日本語

Last Update

2021-09-23

dita:mapPath

ja-JP/wnd1589838592459.ditamap

dita:ditavalPath

ja-JP/ayr1485454803741.ditaval

dita:id

B035-1206

Product Category

Software

Teradata Vantage

TD_ChiSqは、独立性を調べるピアソンのカイ二乗(χ2)検定を実行して、分割表(別名: クロス集計)の1つ以上のカテゴリの予測頻度と観測頻度の間に統計的に有意な差があるかどうかを判別します。

カイ二乗検定は、カテゴリ変数間の統計的に有意な関連性を検出します。この検定によって、カテゴリ変数が統計的に独立しているかどうかが判別されます。

分析用のデータは、分割表と呼ばれるテーブルに編成されます。双方向分割表は、r行とc列で構成されます。次のようになります。

分割表の各セルは、変数1と変数2の特定のレベルの組み合わせが発生した回数です。

例えば、次の双方向分割表には、2つのレベル(Male、Female)があるカテゴリ変数Genderと、2つのレベル(Smokers、Non-smokers)があるカテゴリ変数Affiliationが示されています。

セル数nij (iとjはそれぞれ1、2)は、GenderとAffiliationのレベルがそれぞれithおよびjthになる組み合わせの発生回数です。独立性のχ2検定に対応する帰無仮説H0と対立仮説H1は、次のとおりです。

H0: 2つのカテゴリ変数は独立しています

と

H1: 2つのカテゴリ変数は独立していません

上記のテーブルを使用して、予測されるセル数が計算されます。

e11 = n11 + n21

e12 = n11 + n12

e21 = n21 + n22

e22 = n12 + n22

χ2検定統計量は、次のように計算されます。

χ2統計は、r-1およびc-1の自由度を持つカイ二乗分布に従います。Gender Affiliationテーブルでは、r=2およびc=2になります。χ2stat > χ2r-1,c-1,αの場合、帰無仮説H0は棄却されます(α ϵ {0.10, 0.05, 0.01})。

クラメールのV統計は、次の式を使用して計算されます。

条件

次のルールは、仮説の結論を計算するために使用されます。