CHARSET - Teradata Director Program

Teradata® TDPリファレンス

Product
Teradata Director Program
Release Number
17.10
Published
2021年6月
Language
日本語
Last Update
2021-09-23
dita:mapPath
ja-JP/bvb1608578422774.ditamap
dita:ditavalPath
ja-JP/bvb1608578422774.ditaval
dita:id
B035-2416
Product Category
Teradata Tools and Utilities

CHARSET宣言は、定義および場合によってはエンコーディング スキームを明示的に開始する。

構文



使用方法に関する注意

NAMEは、説明が適用される文字セットを識別します。名前には、エンコーディング スキーマを定義する標準の接尾語を含めることができます。標準の接尾語は、下線、CLIv2とは関連性のない数字、エンコード文字(A、E、I、R、S、T、またはU)、およびCLIv2とは関連性のない任意選択文字から構成されます。各接尾語は、以下のENCODINGオペランド値に対応します。
  • E – EBCDIC
  • I – IBMSOSI
  • A – ASCII
  • R – BIGFIVE
  • S – SJIS
  • T - EUC-CNまたはEUC-KR
  • U – EUC-JP

ENCODINGは、オプションで文字セットのエンコーディング スキーマを識別します。省略する場合には、文字セットにエンコーディングを示す標準の接尾語を含める必要があります。このような接尾語が存在する場合には、このオペランドでエンコーディングを無効にすることはできません。TDPでは、以下の文字セットを使用できます。

ENCODING 意味 特性
EBCDIC 拡張2進化10進コード
  • 1バイト(EBCDIC)コードポイント:

    X'00'からX'FF'

IBMOSI IBMシフトイン/シフトアウト
  • 1バイト(EBCDIC)コードポイント:

    X'00'からX'FF'

  • 2バイト(EBCDIC)コードポイント:

    シフトアウト(X'0E')からシフトイン(X'0E')

ASCII 情報交換用米国標準コード
  • 1バイト(ASCII)コードポイント:

    X'00'からX'FF'

BIGFIVE ビッグ ファイブ プラス
  • 1バイト(ASCII)コードポイント:

    X'00'からX'80'、およびX'FF'

  • 2バイト(ASCII)コードポイント:

    X'81'からX'FE'

EUC-CN 拡張UNIXコード - 中国
  • 1バイト(ASCII)コードポイント:

    X'00'からX'7F'

  • 2バイト(ASCII)コードポイント:

    X'80'からX'FF'

EUC-JP 拡張UNIXコード - 日本
  • 1バイト(ASCII)コードポイント:

    X'00'からX'8D'

    X'90'からX'FF'

  • 2バイト(ASCII)コードポイント:

    シングル シフト1 (X'8E')

  • 3バイト(ASCII)コードポイント:

    シングル シフト2 (X'8F)'

EUC-KR 拡張UNIXコード - 韓国
  • 1バイト(ASCII)コードポイント:

    X'00'からX'7F'

  • 2バイト(ASCII)コードポイント:

    X'80'からX'FF'

SJIS シフトJIS (Japanese Industrial Standard: 日本工業規格)
  • 1バイト(ASCII)コードポイント:

    X'00'からX'80'

    X'A0'からX'DF'

    X'FD'からX'FF'

  • 2バイト(ASCII)コードポイント:

    X'81'からX'9F'

    X'E0'からX'FC'

UHC 統合型ハングル コード
  • 1バイト(ASCII)コードポイント:

    X'00'からX'80'、およびX'FF'

  • 2バイト(ASCII)コードポイント:

    X'81'からX'FE'

UTF8 UCS (Universal Character Set: 汎用文字セット)変換方式8ビット
  • 1バイト(Unicode®)コードポイント:

    X'00'からX'7F'

  • 2バイト(Unicode)コードポイント:

    X'C0'からX'DF'

  • (ほとんどの場合)3バイト(Unicode)コードポイント:

    X'E0'からX'FE'

ほとんどの4バイト コードポイント(X'F0'からX'F4')は、データベースではサポートされていない

UTF16 UCS (Universal Character Set: 汎用文字セット)変換方式16ビット
  • 1バイト(Unicode)コードポイント:

    X'0000'からX'D7FF'

    X'E000'からX'FFFF'

サロゲート(2バイトのコードポイントで開始または終了する4バイトのコードポイントX'D800'からX'DBFF')は、データベースではサポートされていない

NAMEオペランドが指定され、その名前がSET USERCSコマンドで指定した文字セット名と一致しない場合、この宣言と次のCHARSET宣言までのすべての宣言は無視されます。NAMEオペランドが指定されない場合は、この宣言が使用されます。つまり、常にこの宣言が使用されるため、ファイル内の後続のCHARSET宣言は処理されません。

1バイトの文字と複数バイトの文字を混在可能な文字セットでは、すべてのコードポイントがデータベースとの間で反映されますが、TDPコマンド構文では1バイトの文字しか使用できません。

例: CHARSET

IBM CCSID 933の1バイト コンポーネントであるIBM Code Page 833の定義を開始する。

CHARSET NAME KOREAN_EBCDIC933 ENCODING IBMSOSI