17.10 - UTF-8およびUTF-16文字セット - MultiLoad

Teradata® MultiLoadリファレンス

Product
MultiLoad
Release Number
17.10
Release Date
2021年6月
Content Type
プログラミング リファレンス
Publication ID
B035-2409-061K-JPN
Language
日本語 (日本)

Unicode文字セットUTF-8とUTF-16は、Unicode文字データの標準エンコーディング方式です。

UTF-8クライアント文字セットはUTF-8エンコーディングをサポートし、UTF-16クライアント文字セットはUTF-16エンコーディングをサポートします。

データベースでは、UTF-8およびUTF-16クライアント文字セットが使用されている場合、オブジェクト名でマルチバイト文字の使用がサポートされます。Teradata MultiLoadスクリプトのオブジェクト名でマルチバイト文字が使用されている場合は、二重引用符で囲む必要があります。

UTF-8およびUTF-16クライアント文字セットの使用時は、TABLEコマンドを使用しないでください。代わりに、入力レコードのレイアウトを指定します。

データベースでは、UTF-8またはUTF-16文字セットの使用に対して制限が設けられています。制限の詳細については、Teradata Vantage™ - Advanced SQL Engine 国際文字セット サポート, B035-1125を参照してください。

UTF-8文字セット

Teradata MultiLoadはワークステーション接続のプラットフォームおよびIBM z/OSでUTF-8文字セットをサポートします。IBM z/OSでUTF-8クライアント文字セットを使用する場合、ジョブ スクリプトはTeradata EBCDICで記述される必要があります。Teradata MultiLoadはロード時にジョブ スクリプトのTeradata EBCDICのコマンドをUTF-8に変換します。

メインフレーム プラットフォームでUTF-8クライアント文字セットを使用する前に、文字セットの定義を確認し、コード ポイントおよびTeradata EBCDICとUnicode文字のマップを判断します。EBCDICのバージョンによっては、ジョブ スクリプト内のどの位置に特殊文字を配置すべきかが異なる場合があります。詳細については、Teradata Vantage™ - Advanced SQL Engine 国際文字セット サポート, B035-1125を参照してください。メインフレーム プラットフォームでのUTF-8クライアント文字セットの使い方については、以下を参照してください。

  • FIELDで説明されているFIELDコマンド用のnullexprおよびfieldexprの各コマンド パラメータ
  • IMPORTで説明されているIMPORTコマンド用のVARTEXTフォーマット区切り記号とWHERE条件
  • LAYOUTで説明されているLAYOUTコマンド用CONTINUEIF条件

UTF-16文字セット

Teradata MultiLoadは、ワークステーション接続プラットフォームでのUTF-16文字セットをサポートします。一般に、コマンド言語とジョブ出力の文字セットは、ジョブで使用されるクライアントの文字セットと同じです。ただし、UTF-16文字セットを使用する場合、コマンド言語とジョブ出力の文字セットはクライアントの文字セットと同じになる必要はありません。UTF-16文字セットを使用する場合、ジョブ スクリプトとジョブ出力はUTF-8またはUTF-16のいずれかの文字セットになり、これはジョブを呼び出すときに実行時パラメータ「-i」および「-u」で指定します。

実行時パラメータの詳細については、ワークステーション接続構成の実行時パラメータのパラメータ-i scriptencodingとパラメータ-u outputencodingを参照してください。UTF-16クライアント文字セットの使い方については、以下を参照してください。
  • FIELDで説明されているFIELDコマンド用のnullexprおよびfieldexprの各コマンド パラメータ
  • IMPORTで説明されているIMPORTコマンド用のWHERE条件
  • LAYOUTで説明されているLAYOUTコマンド用CONTINUEIF条件