16.20 - NGramSplitterの例 - Teradata Vantage NewSQL Engine

Teradata Vantage™ - NewSQL Engineの分析関数

prodname
Teradata Database
Teradata Vantage NewSQL Engine
vrm_release
16.20
category
プログラミング リファレンス
featnum
B035-1206-162K-JPN

入力

入力テーブルparagraphs_inputには、一般的に使用される機械学習の技術に関する文章が含まれています。

paragraphs_input
paraid paratopic paratext
1 デシジョン ツリー デシジョン ツリーの学習では、デシジョン ツリーを予測モデルとして使用し、ある項目についての結果をその項目の目標値についての結論にマッピングします。これは、統計、データ マイニング、機械学習で使われる予測的なモデリング アプローチの1つです。ターゲットの変数として有限の値セットが可能なツリー モデルは、分類ツリーと呼ばれます。このようなツリー構造では、リーフ(葉)はクラスのラベルを表わし、ブランチ(枝)はこれらのクラス ラベルにつながる機能の結合を表わします。ターゲットの変数として連続する値(通常は実数)が可能なデシジョン ツリーは、回帰ツリーと呼ばれます。
2 単純回帰 統計では、単純な線形回帰は、1つの説明変数を含む線形回帰モデルの最小二乗推定値です。つまり、単純な線形回帰は、モデルの残差二乗和(つまり、データ セットのポイントと当てはまる線の間の垂直距離)の合計を可能な限り小さくするように、n点のセットによって直線を当てはめます。
..。 ..。 ..。

SQL呼び出し

SELECT * FROM NGramSplitter (
  ON paragraphs_input
  USING
  TextColumn ('paratext')
  Grams ('4-6')
  OutputTotalGramCount ('true')
) AS dt;

出力

paraid paratopic ngram n frequency totalcnt
1 デシジョン ツリー decision tree learning uses 4 1 73
1 デシジョン ツリー decision tree learning uses a 5 1 66
1 デシジョン ツリー decision tree learning uses a decision 6 1 60
1 デシジョン ツリー tree learning uses a 4 1 73
1 デシジョン ツリー tree learning uses a decision 5 1 66
1 デシジョン ツリー tree learning uses a decision tree 6 1 60
1 デシジョン ツリー learning uses a decision 4 1 73
1 デシジョン ツリー learning uses a decision tree 5 1 66
1 デシジョン ツリー learning uses a decision tree as 6 1 60
..。 ..。 ..。 ..。 ..。 ..。