テーブル | 説明 |
---|---|
PredictorValues | 結果を予測するテスト データがドキュメントとトークンのペアで含まれています。入力ドキュメントをこのフォームに変換するには、ML Engine関数TextTokenizerまたはTextParserに入力します。 TextTokenizerとTextParserには言語処理の制限があり、Unicode入力データのサポートが制限される場合があります(<Teradata Vantage™ Machine Learning Engine分析関数リファレンス、B700-4003>を参照)。 |
モデル | ML Engine NaiveBayesTextClassifierTrainer2関数によるモデル出力。Teradata Vantage™ Machine Learning Engine分析関数リファレンス、B700-4003 NaiveBayesTextClassifierTrainer関数によって生成されるモデル。スキーマについては、<>を参照してください。 |
PredictorValuesスキーマ
列 | データ型 | 説明 |
---|---|---|
doc_id_column | CHARACTER、VARCHAR、INTEGER、またはSMALLINT | 分類されたテスト トークンを含むドキュメントの識別子。 |
token_column | CHARACTERまたはVARCHAR | テスト トークン。 |
accumulate_column | any | 出力テーブルにコピーする列。 |
モデル スキーマ
CHARACTER列とVARCHAR列では、CHARACTER SETはUNICODEまたはLATINのいずれかである必要があります。
列 | データ型 | 説明 |
---|---|---|
token | CHARACTERまたはVARCHAR | 分類されたトレーニング トークン。 |
category | CHARACTERまたはVARCHAR | トークンの予測カテゴリ。 |
prob | DOUBLE PRECISION | トークンがカテゴリにある確率。 |