| テーブル | 説明 |
|---|---|
| PredictorValues | 結果を予測するテスト データがドキュメントとトークンのペアで含まれています。入力ドキュメントをこのフォームに変換するには、ML Engine関数TextTokenizerまたはTextParserに入力します。 TextTokenizerとTextParserには言語処理の制限があり、Unicode入力データのサポートが制限される場合があります(<Teradata Vantage™ Machine Learning Engine分析関数リファレンス、B700-4003>を参照)。 |
| モデル | ML Engine NaiveBayesTextClassifierTrainer2関数によるモデル出力。Teradata Vantage™ Machine Learning Engine分析関数リファレンス、B700-4003 NaiveBayesTextClassifierTrainer関数によって生成されるモデル。スキーマについては、<>を参照してください。 |
PredictorValuesスキーマ
| 列 | データ型 | 説明 |
|---|---|---|
| doc_id_column | CHARACTER、VARCHAR、INTEGER、またはSMALLINT | 分類されたテスト トークンを含むドキュメントの識別子。 |
| token_column | CHARACTERまたはVARCHAR | テスト トークン。 |
| accumulate_column | any | 出力テーブルにコピーする列。 |
モデル スキーマ
CHARACTER列とVARCHAR列では、CHARACTER SETはUNICODEまたはLATINのいずれかである必要があります。
| 列 | データ型 | 説明 |
|---|---|---|
| token | CHARACTERまたはVARCHAR | 分類されたトレーニング トークン。 |
| category | CHARACTERまたはVARCHAR | トークンの予測カテゴリ。 |
| prob | DOUBLE PRECISION | トークンがカテゴリにある確率。 |