Unicode文字セットUTF-8とUTF-16は、Unicode文字データの標準エンコーディング方式です。
UTF-8クライアント文字セットはUTF-8エンコーディングをサポートし、UTF-16クライアント文字セットはUTF-16エンコーディングをサポートします。
データベースでは、UTF-8およびUTF-16クライアント文字セットが使用されている場合、オブジェクト名でマルチバイト文字の使用がサポートされます。Teradata MultiLoadスクリプトのオブジェクト名でマルチバイト文字が使用されている場合は、二重引用符で囲む必要があります。
UTF-8およびUTF-16クライアント文字セットの使用時は、TABLEコマンドを使用しないでください。代わりに、入力レコードのレイアウトを指定します。
データベースでは、UTF-8またはUTF-16文字セットの使用に対して制限が設けられています。制限の詳細については、Teradata Vantage™ - Advanced SQL Engine 国際文字セット サポート, B035-1125を参照してください。
UTF-8文字セット
Teradata MultiLoadはワークステーション接続のプラットフォームおよびIBM z/OSでUTF-8文字セットをサポートします。IBM z/OSでUTF-8クライアント文字セットを使用する場合、ジョブ スクリプトはTeradata EBCDICで記述される必要があります。Teradata MultiLoadはロード時にジョブ スクリプトのTeradata EBCDICのコマンドをUTF-8に変換します。
メインフレーム プラットフォームでUTF-8クライアント文字セットを使用する前に、文字セットの定義を確認し、コード ポイントおよびTeradata EBCDICとUnicode文字のマップを判断します。EBCDICのバージョンによっては、ジョブ スクリプト内のどの位置に特殊文字を配置すべきかが異なる場合があります。詳細については、Teradata Vantage™ - Advanced SQL Engine 国際文字セット サポート, B035-1125を参照してください。メインフレーム プラットフォームでのUTF-8クライアント文字セットの使い方については、以下を参照してください。
UTF-16文字セット
Teradata MultiLoadは、ワークステーション接続プラットフォームでのUTF-16文字セットをサポートします。一般に、コマンド言語とジョブ出力の文字セットは、ジョブで使用されるクライアントの文字セットと同じです。ただし、UTF-16文字セットを使用する場合、コマンド言語とジョブ出力の文字セットはクライアントの文字セットと同じになる必要はありません。UTF-16文字セットを使用する場合、ジョブ スクリプトとジョブ出力はUTF-8またはUTF-16のいずれかの文字セットになり、これはジョブを呼び出すときに実行時パラメータ「-i」および「-u」で指定します。