17.10 - Advanced SQL Engine分析関数の概要 - Advanced SQL Engine - Teradata Database

Teradata Vantage™ - Advanced SQL Engine分析関数

Product
Advanced SQL Engine
Teradata Database
Release Number
17.10
Release Date
2021年7月
Content Type
プログラミング リファレンス
Publication ID
B035-1206-171K-JPN
Language
日本語 (日本)

Advanced SQL Engine(以前のNewSQLエンジン)分析関数は、データ分析に特化しています。データには、クリックストリーム、財務トランザクション データ、ユーザーの相互関係データが含まれます。

Advanced SQL Engine分析関数
関数名 説明
Antiselect (SQL Engine) AntiSelectはすべての列を返します(指定された列は除く)。
Attribution (SQL Engine) 幅広い分散モデルで属性を計算します。Webページの分析でよく使用されます。
DecisionForestPredict (SQL Engine) Machine Learning Engine (ML Engine) DecisionForest関数で出力されたモデル ファイルを使用して、入力データを分析し予測を行ないます。
DecisionTreePredict (SQL Engine) ML Engine DecisionTree関数で出力されたモデルを使用して、入力データを分析し予測を行ないます。
GLMPredict (SQL Engine) ML Engine GLM関数で出力されたモデルを使用して、入力データを分析し予測を行ないます。
MovingAverage (SQL Engine) 平均値を順次計算します。
NaiveBayesPredict (SQL Engine) ML Engine Naive Bayes分類子関数で出力されたモデル ファイルを使用して、入力データを分析し予測を行ないます。
NaiveBayesTextClassifierPredict (SQL Engine) ML Engine NaiveBayesTextClassifierTrainer関数で出力されたモデルを使用して、入力データを分析し予測を行ないます。
NGramSplitter (SQL Engine) 入力ストリームをトークン化(分割)し、指定された区切り記号とリセット パラメータに基づいて、n multigramを送出します。センチメント分析、トピック識別、文書の分類に便利です。
nPath® (SQL Engine) 1つ以上の入力から一連の行に対して通常のパターン マッチングを実行します。
Pack (SQL Engine) 複数列のデータを1つのデータ列にパックして圧縮します。
Sessionize (SQL Engine) クリックストリーム内の各クリックを固有セッション識別子にマップします。
StringSimilarity (SQL Engine) 指定した比較メソッドを使用して、2つの文字列間の類似性を計算します。
SVMSparsePredict (SQL Engine) ML Engine SVMSparse関数で出力されたモデルを使用して、入力データを分析し予測を行ないます。
Unpack (SQL Engine) 1つのパック済み列から複数の列にデータをアンパックして展開します。

Advanced SQL Engine分析関数には、対応するML Engine関数があります。対応する関数の構文は異なる場合がありますが、同じ入力と構文要素の場合は同じ結果が生成されます(特定の関数に記載されている多少の例外があります)。

Teradata Vantage™ML Engine関数を実行するには、Teradataサポート担当者までお問い合わせください。

データ クリーニング関数

関数名 説明
TD_ConvertTo 指定した入力テーブルの列を指定したデータ型に変換します。
TD_GetRowsWithoutMissingValues 指定した入力テーブル列に非NULL値を持つ行を表示します。
TD_OutlierFilterFit 指定した入力テーブル列のlower_percentile、upper_percentile、行数、および中央値を計算します。
TD_OutlierFilterTransform 入力テーブルから異常値を除外します
TD_SimpleImputeFit 入力テーブルの欠落値の代わりに使用する値のテーブルを出力します。
TD_SimpleImputeTransform 入力テーブルの欠落値を指定した値で置き換えます。

データ調査機能

関数名 説明
TD_CategoricalSummary 指定した各入力テーブル列の固有値とその数を表示します。
TD_ColumnSummary 指定した各入力テーブル列のサマリーを表示します。
TD_GetRowsWithMissingValues 指定した入力テーブル列にNULL値を持つ行を表示します。
TD_Histogram データ セットの度数分布を計算します。
TD_QQNorm 指定した入力テーブル列の値が正規分布をとっているかどうかを確認します。
TD_UnivariateStatistics 指定した各数値入力テーブル列の記述統計を表示します。
TD_WhichMax 指定した入力テーブル列に最大値を持つすべての行を表示します。
TD_WhichMin 指定した入力テーブル列に最小値を持つすべての行を表示します。

特徴量エンジニアリング変換関数

関数名 説明
TD_BinCodeFit 数値データを複数の数値ビン(間隔)にビニングすることによって、数値データをカテゴリデータに変換します。
TD_BinCodeTransform BinCodeFit関数の出力内の入力テーブル列を変換します。
TD_FunctionFit 指定した数値変換を指定した入力列に適用できるかどうかを決定します。
TD_FunctionTransform FunctionFit出力への入力列に数値変換を適用します。
TD_OneHotEncodingFit 属性とカテゴリ値のテーブルをTD_OneHotEncodingTransform関数に出力します。
TD_OneHotEncodingTransform TD_OneHotEncodingFit関数からの出力を使用して、指定した属性とカテゴリ値をワンホット数値ベクトルとしてエンコードします。
TD_PolynomialFeaturesFit 指定したすべての値を表形式で引数に格納します。
TD_PolynomialFeaturesTransform TD_PolynomialFeaturesFit関数の出力から引数の値を抽出して、特徴量のすべての多項式の組み合わせからなる特徴量行列を生成します。
TD_RowNormalizeFit パラメータのテーブルと指定した入力列をTD_RowNormalizeTransformに出力して、そこで入力列を行ごとに正規化します。
TD_RowNormalizeTransform TD_RowNormalizeFit関数の出力を使用して、入力列を行ごとに正規化します。
TD_ScaleFit 統計のテーブルをTD_ScaleTransform関数に出力します。
TD_ScaleTransform TD_ScaleFit関数の出力を使用して、指定した入力テーブルの列を拡張します。

特徴量エンジニアリング ユーティリティ関数

関数名 説明
TD_FillRowID 一意の行識別子からなる列を入力テーブルに追加します。
TD_NumApply 指定した数値演算子を指定した入力テーブル列に適用します。
TD_RoundColumns 指定した各入力テーブル列の値を指定した小数点以下桁数に四捨五入します
TD_StrApply 指定した文字列演算子を指定した入力テーブル列に適用します。

仮説検定関数

関数名 説明
TD_ChiSq 独立性を検定するピアソンのカイ二乗検定を実行します。
TD_FTest F検定を実行します。この検定統計量には、帰無仮説の下でのF分布があります。
TD_ZTest Z検定を実行します。帰無仮説におけるこの検定統計量の分布は、正規分布で近似できます。

その他の情報

トピック 参照
ML Engine関数 Teradata Vantage™ Machine Learning Engine分析関数リファレンス、B700-4003
Aster Analytics関数 Teradata Aster® Analytics Foundation User Guide、B700-1022
Advanced SQL EngineでのML Engine関数により出力されたモデル ファイルのインストール Teradata Vantage™ユーザー ガイド、B700-4002