17.10 - Format - Parallel Transporter

Teradata® Parallel Transporter リファレンス

Product
Parallel Transporter
Release Number
17.10
Published
2022年2月
Content Type
プログラミング リファレンス
Publication ID
B035-2436-061K-JPN
Language
日本語 (日本)
Last Update
2022-02-11

複数のファイル形式をDataConnectorオペレータで処理することができます。 Format属性でファイル形式を指定します。

  • Format = 'Binary' – 各レコードには2バイト整数データ長(n)が含まれ、その後ろにnバイトのデータが続きます。
  • Format = 'Binary4' – 各レコードには4バイト整数データ長(n)が含まれ、その後ろにnバイトのデータが続きます。
  • Format = 'Text' - 各レコードは全体が文字データで、任意のバイト数の後ろに次のいずれかのレコード終了マーカーが続きます。
  • Format = 'Delimited' - 各レコードは可変長のテキスト レコード形式ですが、各レコードにはTextDelimiter属性で定義された1つ以上の区切り文字で区切られたフィールド(列)が含まれ、これには以下の制限があります。
    • 文字のシーケンスのみにできます。
    • データで表示する文字にはできません。
    • タブ以外の制御文字にはできません。

    このファイル形式では、DataConnectorオペレータをプロデューサとして使用する場合、オペレータに関連付けられているTPTスキーマ オブジェクトが、VARCHAR、JSON、JSON BY NAME、CLOB BY NAME、BLOB BY NAME、XML BY NAME、XML、CLOB、またはVARDATE列のみで構成されている必要があります。 指定されていない場合、TextDelimiter属性はデフォルトでパイプ文字( | )に設定されます。

    区切りデータを使用する場合のデフォルトのエスケープ文字はありません。 エスケープ文字を定義するには、DataConnectorオペレータのEscapeTextDelimiter属性を使用します。

    テキスト形式データのレコード終了マーカーを参照してください。

  • Format = 'Formatted' - 各レコードはFastLoadまたはTeradata形式として知られる形式です。これらは2バイト整数(n)、その後ろにnバイトのデータ、レコード終了マーカー(X'0A'またはX'0D0A)が続きます。
  • Format = 'Formatted4' - 長さが64KBを超える行をサポートするFastLoad形式のバージョンです。各レコードは、4バイト整数(n)の後にnバイトのデータが続き、その後にレコード終了マーカー(X'0A'またはX'0D0A')があります。
  • Format = 'Unformatted' - データは事前定義されたどの形式にも一致しません。 代わりに、データはDataConnectorオペレータのスキーマ定義で列によって全体が記述されます。
TDCHインターフェース経由でHadoopのファイルおよびテーブルを処理する場合、データはTPTおよびTDCH間を標識バイトを持つ書式化モードで転送されます。HadoopFileFormat属性の値は、TDCHによって処理されるHadoopのファイルまたはテーブルの形式を決定します。