NaiveBayesTextClassifierPredict入力 - Teradata Database

NaiveBayesTextClassifierPredict入力 - Teradata Database - Teradata Vantage NewSQL Engine

Teradata Vantage™ - NewSQL Engineの分析関数

Product

Teradata Database

Teradata Vantage NewSQL Engine

Release Number

16.20

Published

2019年3月

Language

日本語

Last Update

2019-10-29

dita:mapPath

ja-JP/pqk1526318183991.ditamap

dita:ditavalPath

ja-JP/pqk1526318183991.ditaval

dita:id

B035-1206

Product Category

Software

Teradata Vantage

テーブル	説明
PredictorValues	結果を予測するテストデータがドキュメントとトークンのペアで含まれています。入力ドキュメントをこのフォームに変換するには、ML Engine関数TextTokenizerまたはTextParserに入力します。 TextTokenizerとTextParserには言語処理の制限があり、Unicode入力データのサポートが制限される場合があります(<Teradata Vantage™機械学習エンジン分析関数リファレンス、B700-4003>を参照)。
モデル	ML Engine NaiveBayesTextClassifierTrainer関数によって出力されるモデル。スキーマについては、<Teradata Vantage™機械学習エンジン分析関数リファレンス、B700-4003>を参照してください。

テーブル

説明

PredictorValues

結果を予測するテストデータがドキュメントとトークンのペアで含まれています。入力ドキュメントをこのフォームに変換するには、ML Engine関数TextTokenizerまたはTextParserに入力します。

TextTokenizerとTextParserには言語処理の制限があり、Unicode入力データのサポートが制限される場合があります(<Teradata Vantage™機械学習エンジン分析関数リファレンス、B700-4003>を参照)。

モデル

ML Engine NaiveBayesTextClassifierTrainer関数によって出力されるモデル。スキーマについては、<Teradata Vantage™機械学習エンジン分析関数リファレンス、B700-4003>を参照してください。

列	データ型	説明
doc_id_column	CHARACTER、VARCHAR、INTEGER、またはSMALLINT	(列は指定されたdoc_id_columnごとに一度表示されます。)分類されたトレーニングトークンを含むドキュメントの識別子。
token_column	CHARACTERまたはVARCHAR	分類されたトレーニングトークン。

CHARACTER列とVARCHAR列では、CHARACTER SETはUNICODEまたはLATINのいずれかである必要があります。