複数のファイル形式をDataConnectorオペレータで処理することができます。 Format属性でファイル形式を指定します。
- Format = 'Binary' – 各レコードには2バイト整数データ長(n)が含まれ、その後ろにnバイトのデータが続きます。
- Format = 'Binary4' – 各レコードには4バイト整数データ長(n)が含まれ、その後ろにnバイトのデータが続きます。
- Format = 'Text' - 各レコードは全体が文字データで、任意のバイト数の後ろに次のいずれかのレコード終了マーカーが続きます。
- UNIXプラットフォームの場合、シングルバイトのラインフィード(X'0A')
- Windowsプラットフォームの場合、ダブルバイトの復帰/ラインフィードのペア(X'0D0A')
テキスト形式データのレコード終了マーカーを参照してください。
- Format = 'Delimited' - 各レコードは可変長のテキスト レコード形式ですが、各レコードにはTextDelimiter属性で定義された1つ以上の区切り文字で区切られたフィールド(列)が含まれ、これには以下の制限があります。
- 文字のシーケンスのみにできます。
- データで表示する文字にはできません。
- タブ以外の制御文字にはできません。
このファイル形式では、DataConnectorオペレータをプロデューサとして使用する場合、オペレータに関連付けられているTPTスキーマ オブジェクトが、VARCHAR、JSON、JSON BY NAME、CLOB BY NAME、BLOB BY NAME、XML BY NAME、XML、CLOB、またはVARDATE列のみで構成されている必要があります。 指定されていない場合、TextDelimiter属性はデフォルトでパイプ文字( | )に設定されます。
区切りデータを使用する場合のデフォルトのエスケープ文字はありません。 エスケープ文字を定義するには、DataConnectorオペレータのEscapeTextDelimiter属性を使用します。
テキスト形式データのレコード終了マーカーを参照してください。
- Format = 'Formatted' - 各レコードはFastLoadまたはTeradata形式として知られる形式です。これらは2バイト整数(n)、その後ろにnバイトのデータ、レコード終了マーカー(X'0A'またはX'0D0A)が続きます。
- Format = 'Formatted4' - 長さが64KBを超える行をサポートするFastLoad形式のバージョンです。各レコードは、4バイト整数(n)の後にnバイトのデータが続き、その後にレコード終了マーカー(X'0A'またはX'0D0A')があります。
- Format = 'Unformatted' - データは事前定義されたどの形式にも一致しません。 代わりに、データはDataConnectorオペレータのスキーマ定義で列によって全体が記述されます。
TDCHインターフェース経由でHadoopのファイルおよびテーブルを処理する場合、データはTPTおよびTDCH間を標識バイトを持つ書式化モードで転送されます。HadoopFileFormat属性の値は、TDCHによって処理されるHadoopのファイルまたはテーブルの形式を決定します。