17.10 - TD_Histogram構文要素 - Advanced SQL Engine - Teradata Database

Teradata Vantage™ - Advanced SQL Engine分析関数

Product
Advanced SQL Engine
Teradata Database
Release Number
17.10
Release Date
2021年7月
Content Type
プログラミング リファレンス
Publication ID
B035-1206-171K-JPN
Language
日本語 (日本)
MethodType
データ セットの度数分布の計算方法を指定します。
利用可能な方法 説明
Sturges ビン幅を計算するためのアルゴリズム、w:

w = r/(1 + log2n)

説明:

w = ビンの幅

r = データ値の範囲

n = データ セット内の要素の数

スタージェス アルゴリズムのパフォーマンスは、データが正規分布をとっていて、nが30以上の場合に最高になります。

Scott ビン幅を計算するためのアルゴリズム、w:

w = 3.49s/(n1/3)

説明:

w = ビンの幅

s = データ値の標準偏差値

n = データ セット内の要素の数

r = データ値の範囲

ビンの数: r/w

スコット アルゴリズムは、正規分布のデータに適しています。

Variable-Width

列1と列2でビンの最小値と最大値をそれぞれ指定し、列3でビンのラベルを指定するMinMaxテーブルが必要です。

ビンの最大数は3,500以下にしてください。

Equal-Width

列1でビンの最小値、列2でビンの最大値を指定するMinMaxテーブルが必要です。

ビン幅を計算するためのアルゴリズム、w:

w = (max - min)/k

説明:

min = ビンの最小値

max = ビンの最大値

k = アルゴリズムがデータ セットを分割する間隔の数

間隔の境界: min+wmin+2w、…、min+(k-1)w

TargetColumn
データ セットを含むInputTable列の名前を指定します。
NBins
(メソッドVariable-WidthおよびEqual-Widthでは必須です。それ以外の場合は無視されます。)ビンの数(データ値の範囲の数)を指定します。
Inclusion
(オプション)ビンの境界上のデータ点の配置場所を指定します(境界の左側のビンまたは境界の右側のビン)。
デフォルト: left