フラット ファイルからデータをエクスポートする - Parallel Transporter

Teradata Parallel Transporter ユーザー ガイド

Product
Parallel Transporter
Release Number
16.20
Published
2018年4月
Language
日本語
Last Update
2018-09-07
dita:mapPath
ja-JP/eho1512702793064.ditamap
dita:ditavalPath
ja-JP/eho1512702793064.ditaval
dita:id
B035-2445
Product Category
Teradata Tools and Utilities
  1. ソース タイプ ダイアログ ボックスのジョブ ソース リストから、ファイルを選択します。
  2. 次のいずれかを実行します。
    • ディレクトリ名ファイル名に、ジョブのデータ ソースとして使用するファイルのパスと名前を入力する。
    • 選択をクリックして、ソース ファイルを選択する。


  3. 形式で、ファイルに関連する形式として、BINARYまたはDelimitedFormattedTextUnformattedのいずれかを選択します。 以下のような形式があります。
    • Format = 'Binary' - 各レコードには2バイト整数データ長(n)が含まれ、その後ろにnバイトのデータが続きます。
    • Format = 'Text' - 各レコードは全体が文字データで、任意のバイト数の後ろに
      • UNIXプラットフォームの場合、シングルバイトのラインフィード(X'0A')
      • Windowsプラットフォームの場合、ダブルバイトの復帰/ラインフィードのペア(X'0D0A')
      のいずれかのレコード終了マーカーが続きます。
    • 形式 = Delimited - 各レコードは可変長のテキスト レコード形式ですが、各レコードにはTextDelimiter属性で定義された区切り文字で区切られたフィールド(列)が含まれ、これには
      • 文字のシーケンスのみにできます。
      • データで表示する文字にはできません。
      • タブ以外の制御文字にはできません。
      の制限があります。
    • Format = 'Formatted' - 各レコードはFastLoadまたはTeradata形式として知られる形式です。これらは2バイト整数(n)、その後ろにnバイトのデータ、レコード終了マーカー(X'0A'またはX'0D0A)が続きます。
    • Format = 'Unformatted' - データは事前定義されたどの形式にも一致しません。 代わりに、データはDataConnectorオペレータのスキーマ定義で列によって全体が記述されます。

    区切り記号形式を指定する場合は、ソース ファイル内で使用されている区切り文字を区切り記号ボックスに入力します。 Wizardでは、100バイトまでの長さの区切り文字を入力できます。 区切り文字を指定しない場合、TextDelimiter属性のデフォルト値は、パイプ文字( | )に設定されます。

    区切り記号付きフラット ファイルを入力に使用する場合、DEFINE SCHEMAのデータ型はすべてVARCHARでなければなりません。 VARCHAR以外のデータ型を定義すると、ジョブ スクリプトがサブミットされたときにエラーになります。

    TPTは4バイト レコード長(Formatted4とバイナリ4)でバイナリ データ形式をサポートしていますが、これらのデータ型はWizardを通して利用できません。64KB以上の行でバイナリ データ ファイルを読み込めるスクリプトを作成する詳細については、Teradata Parallel Transporterリファレンス (B035-2424)のDataConnectorオペレータの章を参照してください。

  4. (オプション)各レコードの冒頭に識別子バイトを含める場合は、標識モードを選択します。 (DELIMITEDデータの場合は、この機能は使用できません)。
    ファイル名にワイルドカード文字(*)が含まれている場合は、さらに2つの入力ボックスを使用できます。監視経過時間ボックスには、ジョブが追加のデータを待機する時間を分単位で入力します。監視待ち時間ボックスには、Teradata PTが新しいデータをチェックするまでの待機時間を秒単位で入力します。
  5. 次へをクリックして、列の定義ダイアログ ボックスを開きます。


  6. 列の定義ダイアログ ボックスで、必要に応じて以下を指定します。
    • 名前 – ソース ファイル内の列の名前を入力します。
    • タイプ – 各列のデータ型を入力します。 (前のウィンドウで選択した形式の種類に応じて、選択肢が変わります。)
      区切りデータのファイルからのデータを使用する場合、すべてのフィールドがVARCHAR型として定義されていなければなりません。
    • サイズ – CHAR、VARCHAR、GRAPHIC、VARGRAPHICの各データ型に関連する文字数、およびBYTE型とVARBYTE型に関連するバイト数をそれぞれ入力します。(それ以外はありません。)
  7. (オプション)インスタンスの数に、同時に処理するProducerオペレータ インスタンスの数を入力します。
  8. 精度スケール列は、10進数データ型の場合にのみ使用できます。 精度の下に小数点の左側の桁数を入力し、スケールの下に小数点の右側の桁数を入力します。 その他の場合は、次のステップに進みます。
  9. 列の定義が完了したら、次へをクリックして、ジョブ デスティネーション ダイアログ ボックスを開きます。


  10. ステップ3 - 宛先を選択するに進みます。