テーブル |
説明 |
PredictorValues |
結果を予測するテスト データがドキュメントとトークンのペアで含まれています。入力ドキュメントをこのフォームに変換するには、ML Engine関数TextTokenizerまたはTextParserに入力します。 TextTokenizerとTextParserには言語処理の制限があり、Unicode入力データのサポートが制限される場合があります(<Teradata Vantage™機械学習エンジン分析関数リファレンス、B700-4003>を参照)。
|
モデル |
ML Engine NaiveBayesTextClassifierTrainer関数によって出力されるモデル。スキーマについては、<Teradata Vantage™機械学習エンジン分析関数リファレンス、B700-4003>を参照してください。 |
PredictorValuesスキーマ
列 |
データ型 |
説明 |
doc_id_column |
CHARACTER、VARCHAR、INTEGER、またはSMALLINT |
(列は指定されたdoc_id_columnごとに一度表示されます。)分類されたトレーニング トークンを含むドキュメントの識別子。 |
token_column |
CHARACTERまたはVARCHAR |
分類されたトレーニング トークン。 |
モデル スキーマ
CHARACTER列とVARCHAR列では、CHARACTER SETはUNICODEまたはLATINのいずれかである必要があります。
列 |
データ型 |
説明 |
token |
CHARACTERまたはVARCHAR |
分類されたトレーニング トークン。 |
category |
CHARACTERまたはVARCHAR |
トークンの予測カテゴリ。 |
prob |
DOUBLE PRECISION |
トークンがカテゴリにある確率。 |