このマニュアルで使用している文字簡略表記 - Advanced SQL Engine - Teradata Database

Teradata Vantage™ - SQLデータ操作言語

Product: Advanced SQL Engine; Teradata Database
Release Number: 17.10
Published: 2021年7月
Language: 日本語
Last Update: 2021-09-23
dita:mapPath: ja-JP/vjt1596846980081.ditamap
dita:ditavalPath: ja-JP/wrg1590696035526.ditaval
dita:id: B035-1146
Product Category: Software; Teradata Vantage

このマニュアルでは、文字に対してUnicodeの命名規則を使用します。例えば、英小文字の'a'をより正式に指定すると、「ラテン文字の英大文字A」または「U+0041」となります。「U+xxxx」の表記は、Unicode標準の特定のコードポイントを参照し、xxxxは標準で定義されている16ビット値の16進数表現を表わします。

マニュアルの一部では、特殊文字、または特定の文字のクラスを表現するために記号を使用すると便利です。これは特に、次の日本語文字のエンコーディングについて述べる場合に当てはまります。

KanjiEBCDIC
KanjiEUC
KanjiShift-JIS

これらのエンコーディングは、<Teradata Vantage™ - Advanced SQL Engine国際文字セットサポート、B035-1125>で詳細に説明しています。

文字シンボル

記号は、使用される文字セットに従って、次の表のように定義されています。

記号	エンコーディング	意味
a-z A-Z 0-9	いずれか	任意の1バイトのラテン文字(ローマ字)または数字。
a-z A-Z 0-9	いずれか	任意の全角のラテン文字(ローマ字)または数字。
<	KanjiEBCDIC	シフトアウト[SO] (0x0E)。 KanjiEBCDICのシングルバイト文字からマルチバイト文字への移行を示します。
>	KanjiEBCDIC	シフトイン[SI] (0x0F)。 KanjiEBCDICのマルチバイト文字からシングルバイト文字への移行を示します。
T	いずれか	任意のマルチバイト文字。エンコーディングは、現在の文字セットに依存します。 KanjiEUCの場合、コードセット3文字の前にss3が常に出現します。
I	いずれか	1バイトの半角カタカナ文字 KanjiEUCでは、ss2が先に出現して、個別のマルチバイト文字を形式設定しなければなりません。
Δ	いずれか	グラフィックの空白を表わします。
Δ	いずれか	状況に応じて、1バイトまたはマルチバイトの埋め込み文字を表わします。
ss 2	KanjiEUC	EUCコードセット2と識別子(0x8E)を表わします。
ss3	KanjiEUC	EUCコードセット3の接頭部(0x8F)を表わします。

例えば、各文字を全角とする文字列"TEST"は、TESTと表現します。エンコーディングが重要な場合には、16進数表現が使用されることもあります。

例えば、次のようなKanjiEBCDIC文字セットの1バイト文字/マルチバイト文字が混在したデータがあるとします。

LMN<TEST>QRS

次のように表現されます。

D3 D4 D5 0E 42E3 42C5 42E2 42E3 0F D8 D9 E2

埋込み文字

次の表に、各種文字データ型のスペース文字をリストします。

サーバー文字セット	埋込み文字の名前	埋込み文字の値
LATIN	SPACE	0x20
UNICODE	SPACE	U+0020
GRAPHIC	IDEOGRAPHIC SPACE	U+3000
KANJISJIS	ASCII SPACE	0x20
KANJI1	ASCII SPACE	0x20