TeradataによるDATASETデータ型のサポート - Teradata Database - Teradata Vantage NewSQL Engine

Teradata DATASETデータ型は、スキーマに基づいて解釈される自己記述ファイルを表わす複合データ型(CDT)です。このデータ型は、Teradata DatabaseでのDATASETデータの格納と処理に対応する以下の機能を備えています。

機能	説明
格納と処理	変数データ形式を格納します。Avroおよびカンマ区切り値(CSV)形式がサポートされています。 CDTの変数の最大長または行内の長さを指定します。 DATASET型の任意の組み込み済み格納形式に対応するスキーマを列レベルまたはインスタンスレベルで定義します。列レベルのスキーマは、その特定の列にロードされるデータ型のすべてのインスタンスをバインドするのに対して、インスタンスレベルのスキーマはインスタンスごとに異なる可能性があります。
メソッド、関数およびストアドプロシージャ	DATASET型、任意の格納形式およびスキーマで動作します。
シュレッディング	DATASETドキュメントから値を抽出し、抽出したデータをリレーショナル形式で格納します。
公開	リレーショナルテーブルに格納されているデータを公開し、任意の格納形式およびスキーマでDATASET型を構成します。
分析	DATASETデータに高度な分析を適用します。 DATASET型の抽出部分の統計を収集します。
SQL	標準的なSQLを使用してDATASETデータを問合わせます。

この機能では、データへのアクセスを容易にする拡張ドット表記も利用できます。ドット表記にはDATASETとJSONの両方に対応する以下の構文が含まれています。

再帰下降演算子(..)
ワイルドカード(*) ― 名前付きアイテムとインデックスアイテムの両方を参照
名前/インデックスリスト([a,b,c]または[0,3,5])
名前/インデックススライス([c]または[5])

DATASETデータ型のクライアントサポート

クライアント製品	DATASETのサポート
CLI	DBSを全面的にネイティブサポートしています。
ODBC	ODBCの仕様にはDATASETに固有のデータ型コードが含まれていません。したがって、ODBCドライバは、DATASETデータ型をODBC CLOBデータ型であるSQL_LONGVARCHARまたはSQL_WLONGVARCHARにマッピングします。メタデータはSQL_LONGVARCHARにマッピングされたTeradata CLOBデータ型とSQL_LONGVARCHARにマッピングされたTeradata DATASETデータ型の違いを識別します。 ODBCドライバは、LOB Inputパラメータ、LOB OutputパラメータおよびLOB InputOutputパラメータに対応しており、DATASETデータをロードできます。Catalog (データディクショナリ)関数はDATASETにも対応しています。
JDBC	Teradata JDBCドライバ15.10.00.23以降はDATASET型データをサポートしています。 Teradata JDBCドライバは、アプリケーションがPreparedStatement setObjectメソッドまたはCallableStatement setObjectメソッドを使用してStruct値をDATASETデータ型として疑問符パラメータマーカーにバインドする機能を備えています。アプリケーションはDATASET宛先列にVARBYTE値またはBLOB値を挿入することもできます。 DATASET値をStruct値として指定するTeradata固有の機能をアプリケーションが使用する場合、Struct値にはByte Array、InputStream、BLOBまたはNULLのいずれかの属性が含まれている必要があります。StructにInputStream属性が含まれている場合、Structにはストリーム内のバイト数を指定する整数型である第2の属性も含まれている必要があります。 DATASET値はTeradata DatabaseからBLOB値として取り出されます。アプリケーションは結果セットメタデータまたはパラメータメタデータを使用してBLOB値とDATASET値の違いを識別することができます。
.NETデータプロバイダ	DATASETデータ型はBLOBまたはVARBYTEとして外部化されます。アプリケーションでは、TdBlobまたはTdDataReader.GetBytesを使用してDATASET値を取得できます。アプリケーションでは、DATASET値をBYTE[] としてTeradata Databaseに送信できます。スキーマ集合体(データディクショナリ)は、DATASETデータ型もサポートします。
Teradata Parallel Transporter (TPT)	DATASET列はCLOB列に似ており、同じ制約を受けます。DATASET列は16 MB (16,776,192個のLATIN文字または8,388,096個のUNICODE文字)を超えることはできません。DATASET列をロードまたはエクスポートする場合、TPTユーザーはTPTスキーマ定義でCLOBまたはVARCHARを指定する必要があります。
BTEQ	DATASETキーワードをUSINGデータ文で使用することはできません。したがって、DATASET値はBLOBまたはVARBYTEのいずれかとして参照する必要があります。
スタンドアロンユーティリティ	サポートしません。

用語

データの内容と形式は絶えず変化しており、さまざまなファイルタイプが作成されています。独占所有権が設定されたファイルタイプや特定の業界またはアプリケーションに固有のファイルタイプがある一方、汎用のファイルタイプもあります。

一部のアプリケーションは特定の自己記述ファイル形式を使用します。万能な解決策はありません。さまざまなデータ型を使用することによって柔軟性が高くなります。AvroおよびCSV形式は自己記述データの例です。スキーマが指定されていると、バイトのセットはそのスキーマで記述されている項目のセットとして解釈されます。スキーマにデータが提供され、データが自己記述データになるため、さまざまなアプリケーションがデータを理解できます。

形式、目的、内容または利用頻度を問わず、大量の自己記述データが分析されます。Teradata Databaseはドット表記を使用して、データの格納および操作をデータのネイティブ形式で行ないます。

TeradataによるDATASETデータ型のサポート - Teradata Database - Teradata Vantage NewSQL Engine - Introduction to the DATASET Data Type。

Teradata Vantage™ DATASETデータ型

DATASETデータ型のクライアントサポート

用語

DATASETデータ型のクライアント サポート

用語

DATASETデータ型のクライアントサポート