すべてのTeradataユーティリティは、BTEQを除き、ユーティリティ自体が使用するセッション文字セットについてTeradata Access Module for JMSに通知します。 各ユーティリティのセッション文字セット名を次のように指定します。
- Teradata FastExport、Teradata MultiLoad、またはTeradata TPump - コマンド ラインでランタイムに-c character-set-nameパラメータを指定して、セッション文字セット名を設定します。
- BTEQまたはTeradata FastLoad - スクリプト内に.SET SESSION CHARSETコマンドを指定します。
- Teradata PT – スクリプト内でDEFINE JOB文の前にUSING CHARACTER SET <charset-id>オプションを指定します。
Teradata Access Module for JMSは、Java文字セットに対してTeradataセッション文字セットの固定マッピングを使用します。 このマッピングは、アクセス モジュールのインストール フォルダにあるデフォルトのプロパティ ファイル(charsets.propertiesと呼ばれる)です。 特定のTeradataセッション文字セットに関して、対応するJava文字セットが使用され、メッセージ待ち行列システムに送信されたバイトの符号化と待ち行列システムから受信されたバイトの復号化が行なわれます。 プロパティ ファイルに新しい文字セットを追加し、既存のマッピングを編集できます。
Teradataセッション文字セット | Java文字セット |
---|---|
ASCII | ASCII |
UTF-8 | UTF-8 |
UTF-16 | UnicodeBigUnmarked(ビッグエンディアン プラットフォーム用) |
UTF-16 | UnicodeLittleUnmarked(リトルエンディアン プラットフォーム用) |
EBCDIC037_0E | Cp037 |
EBCDIC273_0E | Cp273 |
EBCDIC277_0E | Cp277 |
HANGULEBCDIC933_1II | Cp933 |
HANGULKSC5601_2R4 | MS949 |
KANJIEBCDIC5026_0I | Cp930 |
KANJIEBCDIC5035_0I | Cp939 |
KANJIEUC_0U | EUC_JP |
KANJISJIS_0S | MS932 |
KATAKANAEBCDIC | CP930 |
LATIN1_0A | ISO8859_1 |
LATIN1252_0A | Cp1252 |
LATIN9_0A | ISO8859_15_FDIS |
SCHEBCDIC935_2IJ | Cp935 |
SCHGB2312_1T0 | EUC_CN |
TCHBIG5_1R0 | BIG5 |
TCHEBCDIC937_3IB | Cp937 |
ASCIIを文字セットとして指定すると、Teradata Access Module for JMSはプラットフォームのデフォルト エンコーディングを使用します。 そのデフォルト エンコーディングがプラットフォーム固有のバイト シーケンスで特定の文字を表現できない場合には、文字変換によってわずかな相違が生じる可能性があります。 完全な一致が必要な場合には、UTF-8セッション文字セットを使用し、文字セット間の変換を防いでください。