17.10 - 文字セットの指定 - MultiLoad

Teradata® MultiLoadリファレンス

Product
MultiLoad
Release Number
17.10
Release Date
2021年6月
Content Type
プログラミング リファレンス
Publication ID
B035-2409-061K-JPN
Language
日本語 (日本)

Vantage for a UNIX systemおよびVantage for Windowsでは、Teradata MultiLoadの起動時に文字セットを設定できます。

Teradata MultiLoadでサポートされているる文字セット

次の表ではTeradata MultiLoadでサポートされる文字セットについて示します。名前の一部に"EBCDIC"が指定されている文字セットは、メインフレーム接続クライアント用です。その他の文字セットはすべてワークステーション接続クライアント用です。

Teradata MultiLoadでサポートされているる文字セット
文字セット名 説明 構成
ASCII ラテン語 ワークステーション接続
EBCDIC ラテン語 メインフレーム接続
HANGULEBCDIC933_1II 韓国語 メインフレーム接続
HANGULKSC5601_2R4 韓国語 ワークステーション接続
SCHEBCDIC935_2IJ 簡体字中国語 メインフレーム接続
SCHGB2312_1T0 簡体字中国語 ワークステーション接続
TCHBIG5_1R0 繁体字中国語 ワークステーション接続
TCHEBCDIC937_31B 繁体字中国語 メインフレーム接続
KATAKANAEBCDIC 日本語 メインフレーム接続
KANJIEBCDIC5026_01 日本語 メインフレーム接続
KANJIEBCDIC5035_01 日本語 メインフレーム接続
KANJIEUC_0U 日本語 ワークステーション接続
KANJISJIS_0S 日本語 ワークステーション接続
UTF-8またはUTF8 Unicode メインフレーム接続

ワークステーション接続

UTF-16またはUTF16 Unicode ワークステーション接続

文字セットの指定方法

次の表に、文字セットを指定する、またはデフォルト指定を適用するための5通りの方法を示します。

文字セットの指定方法
メソッド 説明
構成ファイルの指定 文字セットを指定する最適な方法の1つは、前述したように、Teradata MultiLoad構成ファイル中の文字セット指定により指定する方法です。

CHARSET=character-set-name

この指定を行なうと、実行するたびに文字セットを明示的に指定しなくても、一部またはすべてのTeradata MultiLoadで標準のデフォルト文字セットが使用できるようになります。

実行時パラメータの指定 また、実行時パラメータで説明されているように、Teradata MultiLoadの起動時に文字セット実行時パラメータを使用しても、文字セットを指定できます。
  • CHARSET=character-set-name(メインフレーム接続のz/OSクライアント システムの場合)
  • -c character-set-name (ワークステーション接続のUNIXおよびWindowsクライアント システムの場合)
クライアント システムの設定 もう1つの方法は、Teradata MultiLoadの起動前に次のいずれかを設定して、クライアント システムの文字セットを指定する方法です。
  • HSHSPBパラメータ(メインフレーム接続のz/OSクライアント システムの場合)
  • clispb.datファイル(ワークステーション接続のUNIXおよびWindowsクライアント システムの場合)
Teradata MultiLoadの起動時に行なうcharacter-set-name指定は、クライアント システムでの現行の指定より常に優先されます。
データベースのデフォルト Teradata MultiLoadの起動時にcharacter-set-name指定を使用せず、クライアント システムに文字セットが指定されていない場合、データベースのシステム表DBC.Hostsにあるデフォルトの指定が使用されます。

DBC.Hosts表のデフォルトの文字セットを使用する場合には、最初のログオンを必ず以下のデフォルト文字セットで行なってください。

  • EBCDIC(メインフレーム接続のz/OSクライアント システムの場合)
  • ASCII(ワークステーション接続のUNIXおよびWindowsクライアント システムの場合)
Teradata MultiLoadユーティリティのデフォルト DBC.Hostsに文字セット指定がない場合、Teradata MultiLoadは次のいずれかをデフォルトとして使用します。
  • EBCDIC(メインフレーム接続のz/OSクライアント システムの場合)
  • ASCII(ワークステーション接続のUNIXおよびWindowsクライアント システムの場合)

AXSMODを使用している場合、Teradata MultiLoadは使用の可能性に備えてセッション文字セットを属性としてAXSMODに渡します(ほとんどのAXMODはこの情報を使用しません)。属性名はCHARSET_NAMEであり、属性値は、文字セット名で構成される可変長文字列です。

中国語および韓国語文字セットを使用する場合の規則

メインフレーム接続およびワークステーション接続の各プラットフォーム上で中国語またはハングル語の文字セットを使用する場合は、次の規則に従ってください。

  • オブジェクト名 – オブジェクト名に使用できる文字は、A-Z、a-z、0~9、および $ や _ などの特殊文字に制限されます。
  • 文字列の最大長 – データベースでは、中国語またはハングル語の1文字を処理するのに2バイトを必要とします。この制約は、要求サイズとレコード サイズの両方に関係します。 例えば、レコードを1列で構成する場合、その列の長さは最大で32,000文字、つまり64,000バイトに制限されます。

中国語文字セットまたはハングル語文字セットの制限事項の詳細については、Teradata Vantage™ - Advanced SQL Engine 国際文字セット サポート, B035-1125を参照してください。

代替の文字セットの詳細については、Teradata Vantage™ - SQLデータ定義言語 - 詳細トピック, B035-1184を参照してください。