UNICODE - Teradata Director Program

Teradata® TDPリファレンス

Product
Teradata Director Program
Release Number
17.10
Published
2021年6月
Language
日本語
Last Update
2021-09-23
dita:mapPath
ja-JP/bvb1608578422774.ditamap
dita:ditavalPath
ja-JP/bvb1608578422774.ditaval
dita:id
B035-2416
Product Category
Teradata Tools and Utilities

UNICODE宣言は、小文字と大文字の両方を含む構文文字および文字を定義します。これはCHAR宣言、MONOCASE宣言およびNUMERICS宣言と同じ情報を提供するために使用することもできます。UNICODEはCLIv2にユーザー定義文字セットを追加するために必要です。ユーザー定義文字セットが使いやすくなることがあるため、これはTDPでもサポートされています。文字セットの関連構文文字は、Unicodeコードポイントが0020(スペース)、0022(引用符)、0025(パーセント)、0027(単一引用符)、002C(カンマ)、002E(ピリオド)、002F(スラッシュ)、0030から0039まで(数値0から9まで)、003A(コロン)、005B(左大括弧)、005D(右大括弧)の文字です。文字セットのMONOCASE情報は、Unicodeコードポイントが006~007A(小文字)と0041~005A(大文字)です。CHAR、MONOCASEおよびNUMERICSに関連する範囲を超えるコードポイントは無視されます。文字セットに特性がない場合は、UNICODEではなくCHAR、MONOCASEおよびNUMERICSを使用する必要があります。

構文



使用方法に関する注意

実際の情報は、UNICODE宣言の直後のステートメントに含まれています。このような各ステートメントの構文は、次のようになります。

target_codepoint1<-target_codepoint2>: data_codepoint ...

構文規則:

target_codepoint1
この文で定義されるユーザー定義文字セットの最初の文字を指定する。
target_codepoint2
オプションとして、このステートメントで定義される最後の文字を指定する。data_codepointは、Unicodeの対応する文字を定義する。

codepointは、文字の16進数表現です。ターゲット コードポイントを指定するために必要な文字数は、文字セットのエンコーディング スキーマによって変わります。TDPに関係する文字では、UTF16エンコーディングを除いて長さは常に2です。UTF16エンコーディングの長さは4です。データ コードポイントの長さは常に4です。

2番目のターゲット コードポイントを指定した場合、2つのターゲット コードポイント間の範囲で、各文字に1つのデータ コードポイントが必要になります。2番目のターゲット コードポイントを省略した場合、任意の数のデータ コードポイントを指定できます。各データ コードポイントは、前のデータ コードポイントより1つ大きなコードポイントに関連付けられます。

コロンを含むUNICODE宣言後のすべてのステートメントは、UNICODE宣言に関連付けられます。コロンがない場合は、そのステートメントが新しい宣言で、UNICODE宣言が終了することを示します。

異なる文の間でのデータ コードポイントの順序は、重要ではない。

UNICODE宣言は、文字セットごとに1回だけ宣言できる。

(CHAR宣言、MONOCASE宣言、NUMERICS宣言、またはUNICODE宣言のいずれかによって)同じ文字が同じ目的のために文字セットに対して複数定義されている場合は、最後の値が使用される。

UNICODEの前にCHARSET宣言がない場合、文字セットの説明は実際上、オペランドがないものとしてCHARSET宣言を暗黙的に開始する。

例: UNICODE

IBM CCSID 933の1バイト コンポーネントであるIBM Code Page 833のUnicode対応コードを定義します。

UNICODE
40-47: 0020 001A 115F 1100 1101 1115 1102 11AC
48-4F: 11AD 1103 00A2 002E 003C 0028 002B 007C
50-57: 0026 001A 1104 1105 11B0 11B1 11B2 11B3
58-5F: 11B4 11B5 0021 0024 002A 0029 003B 00AC
60-67: 002D 002F 11B6 1106 1107 1108 1121 1109
68-6F: 110A 110B 00A6 002C 0025 005F 003E 003F
70-77: 005B 001A 110C 110D 110E 110F 1110 1111
78-7F: 1112 0060 003A 0023 0040 0027 003D 0022
80-87: 005D 0061 0062 0063 0064 0065 0066 0067
88-8F: 0068 0069 1161 1162 1163 1164 1165 1166
90-97: 001A 006A 006B 006C 006D 006E 006F 0070
98-9F: 0071 0072 1167 1168 1169 116A 116B 116C
A0-A7: 00AF 007E 0073 0074 0075 0076 0077 0078
A8-AF: 0079 007A 116D 116E 116F 1170 1171 1172
B0-B7: 005E 001A 005C 001A 001A 001A 001A 001A
B8-BF: 001A 001A 1173 1174 1175 001A 001A 001A
C0-C7: 007B 0041 0042 0043 0044 0045 0046 0047
C8-CF: 0048 0049 001A 001A 001A 001A 001A 001A
D0-D7: 007D 004A 004B 004C 004D 004E 004F 0050
D8-DF: 0051 0052 001A 001A 001A 001A 001A 001A
E0-E7: 20A9 001A 0053 0054 0055 0056 0057 0058
E8-EF: 0059 005A 001A 001A 001A 001A 001A 001A
F0-F7: 0030 0031 0032 0033 0034 0035 0036 0037
F8-FF: 0038 0039 001A 001A 001A 001A 001A 001A