Teradata DATASETデータ型は、新しい複合データ型(CDT)であり、スキーマに基づいて解釈される自己記述ファイルを表わします。この機能は、Teradata DatabaseのDATASETデータの格納および処理をサポートする次の機能を提供します。
- Avroファイル形式で格納されているDATASETデータ型です。DATASETデータ型を使用すると、格納形式の変数の型が許可されますが、リリース16.00ではAvroのみがサポートされます。
- DATASETデータの処理、シュレッディング、およびパブリッシングのためのメソッド、関数、およびプロシージャ。
- 最大16 MBまでのDATASETドキュメント。
この機能は、拡張ドット表記を提供します。ドット表記はリリース15.0でJSONデータ型に導入されました。また、現在はDATASETのデータ型に拡張されています。ドット表記には、次の構文が含まれます。
- 再帰下降操作(.。)
- ワイルドカード(*): 名前付きおよびインデックス付き項目の両方への参照
- 名前/インデックス リスト([a,b,c]または[0,3,5])
- 名前/インデックス スライス([a:c]または[0:5])
- 単純名/インデックス参照
利点
DATASETデータ型は、このデータに次の機能を提供します。
- 可変長: 最大長と行内長の両方が可変です。
- 格納されているデータの変数形式: DATASETは、Avro形式の組み込み格納形式をサポートしています。このデータ型は、格納形式の変数型を許可しますが、現在は、アブロのみがサポートされています。
- 任意の形式で格納されているデータの変数のスキーマ: ユーザーは、DATASET型の組み込み格納形式のいずれかの列レベルまたはインスタンス レベルでスキーマを定義する可能性があります。列レベルのスキーマは、その特定の列にロードされるすべてのデータ型のインスタンスにバインドされています。この列では、インスタンス レベルのスキーマは、インスタンス間で異なる場合があります。
- メソッド: DATASET型を任意の格納形式と任意のスキーマで操作するメソッド。
- 関数: DATASET型を任意の格納形式と任意のスキーマで操作する関数。
- DATASETデータ型にパブリッシング: リレーショナル テーブルに格納されたデータを使用して、任意の格納形式およびスキーマを使用してDATASET型を作成します。
- DATASETのシュレッディング: DATASETドキュメントから値を抽出して、抽出したデータをリレーショナル形式で格納できます。
DATASETデータ型として格納されたAvroデータは、VARBYTEまたはBLOBとしてSQLと変換されます。
SQLの変更
新しいDATASETデータ型の文を次に示します。
- CREATE <storage-format-name> SCHEMA
- DROP <storage-format-name> SCHEMA
- SHOW <storage-format-name> SCHEMA
- HELP <storage-format-name> SCHEMA
- SET SESSION DOT NOTATION
変更されたDATASETデータ型の文を次に示します。
- CREATE TABLE
- ALTER TABLE
- CREATE/REPLACE FUNCTION
- CREATE INDEX
- COLLECT STATISTICS
- HELP、SHOW、およびTYPEコマンド
追加情報
詳細については、<Teradata Vantage™ DATASETデータ型、B035-1198>を参照してください。