UTF-8およびUTF-16はそれぞれ、Unicode文字データの標準的なエンコーディング方法です。UTF-8クライアント文字セットは、UTF-8のエンコーディングをサポートしています。現在、データベースでは、1~3バイトで構成されるUTF8文字をサポートしています。UTF-16クライアント文字セットは、UTF-16のエンコーディングをサポートしています。現在、VantageではUnicode2.1規格をサポートしています。Unicode2.1では定義済み文字ごとに16バイトが必要です。
UTF-8またはUTF-16文字セットの使用時には、Vantageによっていくつかの制限が課されます。制限の詳細については、Teradata Vantage™ - Advanced SQL Engine 国際文字セット サポート, B035-1125を参照してください。
UTF-8文字セット
FastExportはワークステーション接続のプラットフォームやIBM z/OSでのUTF-8文字セットをサポートします。IBM z/OSでUTF-8クライアント文字セットを使用する場合、ジョブ スクリプトはTeradata EBCDICで記述される必要があります。FastExportはジョブ スクリプトのコマンドを、エクスポート時にTeradata EBCDICからUTF-8に変換します。
ジョブ スクリプトで必要となる、特殊文字のコード ポイントを判断するには、Teradata Vantage™ - Advanced SQL Engine 国際文字セット サポート, B035-1125の定義を確認してください。
EBCDICのバージョンが異なる場合、これらの文字列置換が必ずしも一致するとは限りません。Teradata EBCDICおよびUnicodeのマッピングに関する詳細は、Teradata Vantage™ - Advanced SQL Engine 国際文字セット サポート, B035-1125を参照してください。
UTF-16文字セット
FastExportは、ワークステーション接続のプラットフォームでUTF-16文字セットをサポートします。通常、コマンド言語およびジョブ出力は、ジョブで使用したクライアント文字セットと同一である必要があります。ただし、ユーザーの利便性、さらにはUnicodeの特別な属性のため、UTF-16文字セットを使用する場合には、コマンド言語およびジョブ出力がクライアント文字セットと同一であることは要求されません。UTF-16文字セットを使用する場合、ジョブ スクリプトおよびジョブ出力はUTF-8またはUTF-16文字セットのいずれかとすることができます。これは、ジョブの起動時に実行時パラメータ"-i"および"-u"を指定することによって提供されます。
実行時パラメータ"-i"および"-u"の詳細については、ワークステーション接続システムの実行時パラメータを参照してください。
次の表で、文字セットの指定またはデフォルト指定の受け入れに使用する方法を4つ挙げて説明します。
メソッド | 説明 |
---|---|
クライアント システムの設定 | 別の方法を以下に記載します。以下のように構成することにより、FastExportの呼び出し前にクライアント システムの文字セットを指定できます。
FastExportの呼び出し時に使用されたcharacter- set- name指定は、現在のクライアント システム指定よりも常に優先されます。
|
FastExportユーティリティのデフォルト | DBC.Hostsに文字セットの指定がない場合、FastExportはデフォルトとして以下の文字セットをとります。
|
実行時パラメータの指定 | 前述したように、FastExportの呼び出し時に文字セット実行時パラメータを指定するのが、文字セットを指定する最善の方法です。
有効な文字セット名については、文字セットの指定を参照してください。 |
データベース デフォルト | FastExportの呼び出し時にcharacter- set- name指定が使用されず、使用しているクライアント システムに対応する文字セット指定がない場合、FastExportユーティリティはデータベース システム表DBC.Hostsのデフォルト指定を使用します。 デフォルトの文字セットとしてDBC.Hosts表の指定をそのまま使用する場合は、初期ログオンが以下のようなデフォルトの文字セットで行なわれることを確認します。
|