TD_OutlierFilterFit構文要素 - Advanced SQL Engine

TD_OutlierFilterFit構文要素 - Advanced SQL Engine - Teradata Database

Teradata Vantage™ - Advanced SQL Engine分析関数

Product

Advanced SQL Engine

Teradata Database

Release Number

17.10

Published

2021年7月

Language

日本語

Last Update

2021-09-23

dita:mapPath

ja-JP/wnd1589838592459.ditamap

dita:ditavalPath

ja-JP/ayr1485454803741.ditaval

dita:id

B035-1206

Product Category

Software

Teradata Vantage

TargetColumns

測定基準を計算するInputTable数値列の名前を指定します。

GroupColumns

(オプション)入力データをグループ化する基準となるInputTable列の名前を指定します。

デフォルトの動作: 関数は入力データをグループ化しません。

OutlierMethod

異常値をフィルタリングするには、次のいずれかの方法を指定します。

メソッド	値が異常値とならない範囲
percentile	[min_value, max_value].
tukey	[Q1 - k(Q3-Q1), Q1 + k(Q3-Q1)] 説明: Q1 = データの25番目の四分位数 Q3 = データの75番目の四分位数 k = 四分位範囲の乗数(IQRMultiplierを参照)
carling	Q2 ± c(Q3-Q1) 説明: Q2 = データの中央値 Q1 = データの25番目の四分位数 Q3 = データの75番目の四分位数 c = (17.63r - 23.64) / (7.74*r - 3.71) GroupColumnsを指定した場合、rはgroup_columnの行数。それ以外の場合はInputTableの行数。

メソッド

値が異常値とならない範囲

percentile

[min_value, max_value].

tukey

[Q1 - k*(Q3-Q1), Q1 + k*(Q3-Q1)]

説明:

Q1 = データの25番目の四分位数

Q3 = データの75番目の四分位数

k = 四分位範囲の乗数(IQRMultiplierを参照)

carling

Q2 ± c*(Q3-Q1)

説明:

Q2 = データの中央値

Q1 = データの25番目の四分位数

Q3 = データの75番目の四分位数

c = (17.63*r - 23.64) / (7.74*r - 3.71)

GroupColumnsを指定した場合、rはgroup_columnの行数。それ以外の場合はInputTableの行数。

LowerPercentile

値が異常値であるかどうかを検出するために使用するパーセンタイルの下側範囲を指定します。

0～1の値がサポートされています。tukeyとcarlingの場合、下側パーセンタイルとして0.25を使用します。

UpperPercentile

値が異常値であるかどうかを検出するために使用するパーセンタイルの上側範囲を指定します。

0～1の値がサポートされています。tukeyとcarlingの場合、上側パーセンタイルとして0.75を使用します。

IQRMultiplier

tukeyフィルタリングの場合は、四分位範囲乗数(IQR)kを指定します。

IQRは、ターゲット列のデータの広がり(分散)の推定値です(IQR = |Q3-Q1|)。

中程度の異常値にはk = 1.5を使用し、大幅な異常値にはk = 3.0を使用します。

デフォルト: 1.5

ReplacementValue

異常値の処理方法を指定します。

オプション	説明
delete	行を出力テーブルにコピーしません。
NULL	行を出力テーブルにコピーし、各異常値をNULLに置き換えます。
median	行を出力テーブルにコピーし、各異常値をグループの中央値に置き換えます。
replacement_value (数値を指定する必要がある)	行を出力テーブルにコピーし、各異常値をreplacement_valueに置き換えます。

RemoveTail

(オプション)上側、下側、またはその両方を削除するかどうかを指定します。

デフォルト: both

PercentileMethod

入力データ値の上側パーセンタイルと下側パーセンタイルを計算する方法として、PercentileContメソッドまたはPercentileDISCメソッドを指定します。