17.10 - TD_OutlierFilterFit構文要素 - Advanced SQL Engine - Teradata Database

Teradata Vantage™ - Advanced SQL Engine分析関数

Product
Advanced SQL Engine
Teradata Database
Release Number
17.10
Release Date
2021年7月
Content Type
プログラミング リファレンス
Publication ID
B035-1206-171K-JPN
Language
日本語 (日本)
TargetColumns
測定基準を計算するInputTable数値列の名前を指定します。
GroupColumns
(オプション)入力データをグループ化する基準となるInputTable列の名前を指定します。
デフォルトの動作: 関数は入力データをグループ化しません。
OutlierMethod
異常値をフィルタリングするには、次のいずれかの方法を指定します。
メソッド 値が異常値とならない範囲
percentile [min_value, max_value].
tukey [Q1 - k*(Q3-Q1), Q1 + k*(Q3-Q1)]

説明:

Q1 = データの25番目の四分位数

Q3 = データの75番目の四分位数

k = 四分位範囲の乗数(IQRMultiplierを参照)

carling Q2 ± c*(Q3-Q1)

説明:

Q2 = データの中央値

Q1 = データの25番目の四分位数

Q3 = データの75番目の四分位数

c = (17.63*r - 23.64) / (7.74*r - 3.71)

GroupColumnsを指定した場合、rgroup_columnの行数。それ以外の場合はInputTableの行数。

LowerPercentile
値が異常値であるかどうかを検出するために使用するパーセンタイルの下側範囲を指定します。
0~1の値がサポートされています。tukeyとcarlingの場合、下側パーセンタイルとして0.25を使用します。
UpperPercentile
値が異常値であるかどうかを検出するために使用するパーセンタイルの上側範囲を指定します。
0~1の値がサポートされています。tukeyとcarlingの場合、上側パーセンタイルとして0.75を使用します。
IQRMultiplier
tukeyフィルタリングの場合は、四分位範囲乗数(IQR)kを指定します。
IQRは、ターゲット列のデータの広がり(分散)の推定値です(IQR = |Q3-Q1|)。
中程度の異常値にはk = 1.5を使用し、大幅な異常値にはk = 3.0を使用します。
デフォルト: 1.5
ReplacementValue
異常値の処理方法を指定します。
オプション 説明
delete 行を出力テーブルにコピーしません。
NULL 行を出力テーブルにコピーし、各異常値をNULLに置き換えます。
median 行を出力テーブルにコピーし、各異常値をグループの中央値に置き換えます。
replacement_value

(数値を指定する必要がある)

行を出力テーブルにコピーし、各異常値をreplacement_valueに置き換えます。
RemoveTail
(オプション)上側、下側、またはその両方を削除するかどうかを指定します。
デフォルト: both
PercentileMethod
入力データ値の上側パーセンタイルと下側パーセンタイルを計算する方法として、PercentileContメソッドまたはPercentileDISCメソッドを指定します。