ジョブ例11: TDCH-TPTインターフェースを使用したHadoopテーブルのロード - Parallel Transporter

Teradata Parallel Transporter ユーザー ガイド

Product
Parallel Transporter
Release Number
16.20
Published
2018年4月
Language
日本語
Last Update
2018-09-07
dita:mapPath
ja-JP/eho1512702793064.ditamap
dita:ditavalPath
ja-JP/eho1512702793064.ditaval
dita:id
B035-2445
Product Category
Teradata Tools and Utilities

ジョブの目的

TPTスクリプトを複数のジョブ ステップとともに使用して、以下のタスクを実行します。

  • Teradata Databaseで新しいテーブルを作成します。
  • Hadoopテーブルからデータを読み取り、データを新しく作成したTeradata Databaseテーブルに書き込みます。

データ フロー図

以下の図に、ジョブ例11の要素のフロー図を示します。

ジョブ例PTS00030 – TDCH-TPTインターフェースを使用したHadoopテーブルのロード

サンプル スクリプト

このジョブに対応するサンプル スクリプトについては、sample/userguideディレクトリの以下のスクリプトを参照してください。

PTS00030: TDCH-TPTインターフェースを使用したHadoopテーブルのロード

使用理由

最初のジョブ ステップで、このスクリプトは以下を使用します。

  • DDLオペレータ。ロード前にテーブルを削除/作成できるためです。

2番目のジョブ ステップで、このスクリプトは以下を使用します。

  • ProducerオペレータとしてのDataConnectorオペレータ。 TDCH-TPTインターフェース経由でデータをHadoopテーブルから読み取ることができるためです。
  • コンシューマとしてのLoadオペレータ テンプレート。これは、大量の行をTeradata Databaseテーブルに高速に書き込む際に最も高いパフォーマンスを提供するConsumerオペレータであるためです。