Teradata DATASETデータ型は、スキーマに基づいて解釈される自己記述ファイルを表わす複合データ型(CDT)です。このデータ型は、データベースでのDATASETデータの格納と処理に対応する以下の機能を備えています。
機能 | 説明 |
---|---|
格納と処理 |
|
メソッド、関数およびストアド プロシージャ | DATASET型、任意の格納形式およびスキーマで動作します。 |
シュレッディング | DATASETドキュメントから値を抽出し、抽出したデータをリレーショナル形式で格納します。 |
公開 | リレーショナル テーブルに格納されているデータを公開し、任意の格納形式およびスキーマでDATASET型を構成します。 |
分析 |
|
SQL | 標準的なSQLを使用してDATASETデータを問合わせます。 |
この機能では、データへのアクセスを容易にする拡張ドット表記も利用できます。ドット表記にはDATASETとJSONの両方に対応する以下の構文が含まれています。
- 再帰下降演算子(..)
- ワイルドカード(*) ― 名前付きアイテムとインデックス アイテムの両方を参照
- 名前/インデックス リスト([a,b,c]または[0,3,5])
- 名前/インデックス スライス([c]または[5])
DATASETデータ型のクライアント サポート
クライアント製品 | DATASETのサポート |
---|---|
CLI | DBSを全面的にネイティブ サポートしています。 |
ODBC |
|
JDBC |
|
.NETデータ プロバイダ |
|
Teradata Parallel Transporter (TPT) | DATASET列はCLOB列に似ており、同じ制約を受けます。DATASET列は16 MB (16,776,192個のLATIN文字または8,388,096個のUNICODE文字)を超えることはできません。DATASET列をロードまたはエクスポートする場合、TPTユーザーはTPTスキーマ定義でCLOBまたはVARCHARを指定する必要があります。 |
BTEQ | DATASETキーワードをUSINGデータ文で使用することはできません。したがって、DATASET値はBLOBまたはVARBYTEのいずれかとして参照する必要があります。 |
スタンドアロン ユーティリティ | サポートしません。 |
用語
データの内容と形式は絶えず変化しており、さまざまなファイル タイプが作成されています。独占所有権が設定されたファイル タイプや特定の業界またはアプリケーションに固有のファイル タイプがある一方、汎用のファイル タイプもあります。
一部のアプリケーションは特定の自己記述ファイル形式を使用します。万能な解決策はありません。さまざまなデータ型を使用することによって柔軟性が高くなります。AvroおよびCSV形式は自己記述データの例です。スキーマが指定されていると、バイトのセットはそのスキーマで記述されている項目のセットとして解釈されます。スキーマにデータが提供され、データが自己記述データになるため、さまざまなアプリケーションがデータを理解できます。
形式、目的、内容または利用頻度を問わず、大量の自己記述データが分析されます。データベースはドット表記を使用して、データの格納および操作をデータのネイティブ形式で行ないます。