ジョブの詳細設定について - Teradata Data Mover

Teradata® Data Mover ユーザー ガイド

Product
Teradata Data Mover
Release Number
16.20
Published
2021年11月
Language
日本語
Last Update
2021-12-02
dita:mapPath
ja-JP/wph1512683331242.ditamap
dita:ditavalPath
ja-JP/mpm1591127278842.ditaval
dita:id
B035-4101
Product Category
Analytical Ecosystem
ジョブの詳細設定オプションは、ジョブの設定タブから選択できます。ジョブのパフォーマンスの設定にアクセスするには、詳細をクリックします。Data Moverでは、これらの設定のデフォルト値が用意されています。
Teradataシステム
Teradataシステムには、次のジョブの詳細設定オプションを選択できます。
データ ストリーム
Teradata ARCまたはTeradata PT APIのジョブに対して、ソース データベースとターゲット データベース間で使用するデータ ストリームの数を指定します。DSAジョブの場合は、データベース ノードあたりのストリーム数を指定します。他のすべてのユーティリティでは、単一のデータ ストリームを使用します。
ソースのセッション
ソース システムのデータ ストリームごとのセッション数を指定します。
ターゲットのセッション
ターゲット システムのデータ ストリームごとのセッション数を指定します。
タスク別の最大エージェントの数
Teradata ARCまたはTeradata PT APIを使用するジョブ内の1つのタスクに対してData Moverが同時に割り当てるエージェントの最大数を指定します。Data Mover環境に複数のエージェントがインストールされている場合は、1より大きい整数値を入力して、大量のデータをコピーするジョブのパフォーマンスを改善できます。タスク別の最大エージェントの数の値を提供しなければ、Data Moverは、実行時に値を動的に計算します。
使用するユーティリティ
コピー ジョブに対してData Moverに特定のTeradataユーティリティまたはAPIオペレータを強制的に使用させます。Data Moverは、ジョブに最適なユーティリティを自動的に選択します。
ソース文字セット
ソース システムとの通信に使用するセッション文字セットを指定します。
ターゲット文字セット
ターゲット システムとの通信に使用するセッション文字セットを指定します。
ターゲット グループ名
Data Moverによる自動選択は行なわないで、DSAジョブを実行する共有パイプ ターゲット グループを指定します。指定したターゲット グループが存在しない場合、ジョブは失敗します。
並列ビルド
DSAを使用するときに同時に構築可能なインデックスを持つテーブルの数を指定します。同時ビルドの最大数は5(デフォルト値)です。
TeradataシステムおよびHadoopシステム
TeradataからHadoopおよびHadoopからTeradataの場合、次のジョブの詳細設定オプションを選択できます。
使用するユーティリティ
Data MoverでHadoopコピー操作に特定のユーティリティを使用することを強制します。Data MoverデーモンではSQL-Hがテーブルの移動に使用されます。SQL-Hを使用できない場合、Teradata Connector for Hadoop (TDCH)がテーブルの移動に使用されます。
転送方法
TeradataからHadoopにデータを転送するための次のオプションをサポートするHadoopのTeradataコネクタ。
TeradataからHadoopに転送する際のオプション 説明
Default 転送方法が指定されていない場合、Data MoverはデフォルトでAMPを選択します。
Hash 基礎となるHadoopコネクタはTeradataのソース テーブルから指定されたsplit-by列の特定のハッシュ値範囲の行を取得し、これらのレコードをHDFSのターゲット ファイルに書き込みます。
Value 基礎となるHadoopコネクタはTeradataのソース テーブルから指定されたsplit-by列の特定の値範囲の行を取得し、これらのレコードをHDFSのターゲット ファイルに書き込みます。
Partition 基になるhadoopコネクタは、ソース テーブルがPPIテーブル以外の場合にソース データベースにPPIのステージング テーブルを作成します。
AMP 基礎となるHadoopコネクタはTeradataのソース テーブルから1つ以上のAMPの行を取得し、それらのレコードをHDFSのターゲット ファイルに書き込みます。AMPオプションはTeradata Databaseのバージョンが14.10以降である場合にのみサポートされます。
HadoopからTeradataにデータを転送するための次のオプションをサポートするHadoopのTeradataコネクタ。
HadoopからTeradataに転送する際のオプション 説明
Default Data Moverはinternal_fastloadを選択します。
batch.insert 基礎となるHadoopコネクタはJDBCバッチ実行によって行をNOPIステージング テーブルに挿入します。すべてのMapperがその処理を完了した後、ステージング テーブルの行がInsert-Select SQL操作によってターゲット テーブルに移動されます。batch.insertが選択されている場合、サイズ プロパティを指定することもできます。値は行の数です(10000、50000など)。
internal.fastload 基礎となるHadoopコネクタはデータベースFastLoadセッションを開始して、行を単一のNOPIステージング テーブルにロードします。すべてのデータベースFastLoadセッションは内部プロトコルによって調整されます。すべてのMapperがセッションを完了した後にFastloadジョブが終了すると、NOPIステージング テーブルの行がInsert-Select SQL操作によってターゲット テーブルにコピーされます。
Mapperの数
TeradataコネクタがTeradata Databaseからデータを取り込む際に使用するMapperの数を指定します。