CHARSET - Teradata Director Program

Teradata® TDPリファレンス

Product

Teradata Director Program

Release Number

17.10

Published

2021年6月

Language

日本語

Last Update

2021-09-23

dita:mapPath

ja-JP/bvb1608578422774.ditamap

dita:ditavalPath

ja-JP/bvb1608578422774.ditaval

dita:id

B035-2416

Product Category

Teradata Tools and Utilities

CHARSET宣言は、定義および場合によってはエンコーディングスキームを明示的に開始する。

構文

使用方法に関する注意

NAMEは、説明が適用される文字セットを識別します。名前には、エンコーディングスキーマを定義する標準の接尾語を含めることができます。標準の接尾語は、下線、CLIv2とは関連性のない数字、エンコード文字(A、E、I、R、S、T、またはU)、およびCLIv2とは関連性のない任意選択文字から構成されます。各接尾語は、以下のENCODINGオペランド値に対応します。

E – EBCDIC
I – IBMSOSI
A – ASCII
R – BIGFIVE
S – SJIS
T - EUC-CNまたはEUC-KR
U – EUC-JP

ENCODINGは、オプションで文字セットのエンコーディングスキーマを識別します。省略する場合には、文字セットにエンコーディングを示す標準の接尾語を含める必要があります。このような接尾語が存在する場合には、このオペランドでエンコーディングを無効にすることはできません。TDPでは、以下の文字セットを使用できます。

ENCODING	意味	特性
EBCDIC	拡張2進化10進コード	1バイト(EBCDIC)コードポイント: X'00'からX'FF'
IBMOSI	IBMシフトイン/シフトアウト	1バイト(EBCDIC)コードポイント: X'00'からX'FF' 2バイト(EBCDIC)コードポイント: シフトアウト(X'0E')からシフトイン(X'0E')
ASCII	情報交換用米国標準コード	1バイト(ASCII)コードポイント: X'00'からX'FF'
BIGFIVE	ビッグファイブプラス	1バイト(ASCII)コードポイント: X'00'からX'80'、およびX'FF' 2バイト(ASCII)コードポイント: X'81'からX'FE'
EUC-CN	拡張UNIXコード - 中国	1バイト(ASCII)コードポイント: X'00'からX'7F' 2バイト(ASCII)コードポイント: X'80'からX'FF'
EUC-JP	拡張UNIXコード - 日本	1バイト(ASCII)コードポイント: X'00'からX'8D' X'90'からX'FF' 2バイト(ASCII)コードポイント: シングルシフト1 (X'8E') 3バイト(ASCII)コードポイント: シングルシフト2 (X'8F)'
EUC-KR	拡張UNIXコード - 韓国	1バイト(ASCII)コードポイント: X'00'からX'7F' 2バイト(ASCII)コードポイント: X'80'からX'FF'
SJIS	シフトJIS (Japanese Industrial Standard: 日本工業規格)	1バイト(ASCII)コードポイント: X'00'からX'80' X'A0'からX'DF' X'FD'からX'FF' 2バイト(ASCII)コードポイント: X'81'からX'9F' X'E0'からX'FC'
UHC	統合型ハングルコード	1バイト(ASCII)コードポイント: X'00'からX'80'、およびX'FF' 2バイト(ASCII)コードポイント: X'81'からX'FE'
UTF8	UCS (Universal Character Set: 汎用文字セット)変換方式8ビット	1バイト(Unicode®)コードポイント: X'00'からX'7F' 2バイト(Unicode)コードポイント: X'C0'からX'DF' (ほとんどの場合)3バイト(Unicode)コードポイント: X'E0'からX'FE' ほとんどの4バイトコードポイント(X'F0'からX'F4')は、データベースではサポートされていない。
UTF16	UCS (Universal Character Set: 汎用文字セット)変換方式16ビット	1バイト(Unicode)コードポイント: X'0000'からX'D7FF' X'E000'からX'FFFF' サロゲート(2バイトのコードポイントで開始または終了する4バイトのコードポイントX'D800'からX'DBFF')は、データベースではサポートされていない。

NAMEオペランドが指定され、その名前がSET USERCSコマンドで指定した文字セット名と一致しない場合、この宣言と次のCHARSET宣言までのすべての宣言は無視されます。NAMEオペランドが指定されない場合は、この宣言が使用されます。つまり、常にこの宣言が使用されるため、ファイル内の後続のCHARSET宣言は処理されません。

1バイトの文字と複数バイトの文字を混在可能な文字セットでは、すべてのコードポイントがデータベースとの間で反映されますが、TDPコマンド構文では1バイトの文字しか使用できません。

例: CHARSET

IBM CCSID 933の1バイトコンポーネントであるIBM Code Page 833の定義を開始する。

CHARSET NAME KOREAN_EBCDIC933 ENCODING IBMSOSI