CHARSET宣言は、定義および場合によってはエンコーディング スキームを明示的に開始する。
構文
使用方法に関する注意
- E – EBCDIC
- I – IBMSOSI
- A – ASCII
- R – BIGFIVE
- S – SJIS
- T - EUC-CNまたはEUC-KR
- U – EUC-JP
ENCODINGは、オプションで文字セットのエンコーディング スキーマを識別します。省略する場合には、文字セットにエンコーディングを示す標準の接尾語を含める必要があります。このような接尾語が存在する場合には、このオペランドでエンコーディングを無効にすることはできません。TDPでは、以下の文字セットを使用できます。
ENCODING | 意味 | 特性 |
---|---|---|
EBCDIC | 拡張2進化10進コード |
|
IBMOSI | IBMシフトイン/シフトアウト |
|
ASCII | 情報交換用米国標準コード |
|
BIGFIVE | ビッグ ファイブ プラス |
|
EUC-CN | 拡張UNIXコード - 中国 |
|
EUC-JP | 拡張UNIXコード - 日本 |
|
EUC-KR | 拡張UNIXコード - 韓国 |
|
SJIS | シフトJIS (Japanese Industrial Standard: 日本工業規格) |
|
UHC | 統合型ハングル コード |
|
UTF8 | UCS (Universal Character Set: 汎用文字セット)変換方式8ビット |
ほとんどの4バイト コードポイント(X'F0'からX'F4')は、データベースではサポートされていない。 |
UTF16 | UCS (Universal Character Set: 汎用文字セット)変換方式16ビット |
サロゲート(2バイトのコードポイントで開始または終了する4バイトのコードポイントX'D800'からX'DBFF')は、データベースではサポートされていない。 |
NAMEオペランドが指定され、その名前がSET USERCSコマンドで指定した文字セット名と一致しない場合、この宣言と次のCHARSET宣言までのすべての宣言は無視されます。NAMEオペランドが指定されない場合は、この宣言が使用されます。つまり、常にこの宣言が使用されるため、ファイル内の後続のCHARSET宣言は処理されません。
1バイトの文字と複数バイトの文字を混在可能な文字セットでは、すべてのコードポイントがデータベースとの間で反映されますが、TDPコマンド構文では1バイトの文字しか使用できません。
例: CHARSET
IBM CCSID 933の1バイト コンポーネントであるIBM Code Page 833の定義を開始する。
CHARSET NAME KOREAN_EBCDIC933 ENCODING IBMSOSI