17.10 - ELT方式によるロード - Parallel Transporter

Teradata® Parallel Transporter ユーザー ガイド

Product
Parallel Transporter
Release Number
17.10
Release Date
2021年6月
Content Type
ユーザー ガイド
Publication ID
B035-2445-061K-JPN
Language
日本語 (日本)

ほとんどのサードパーティ製データ ウェアハウス製品では、ロード前のデータ クレンジングやデータ フィルタリング用にさまざまなデータ変換ツールが用意されているのが一般的ですが、Teradata PTが重視しているのは、VantageのSQLのパワーでデータをさまざまな形で処理できるデータベース テーブルに、いかに高速にデータをロードするかということです。この機能により、ELT(Extract、Load、Transform)と呼ばれる新しいロード方式が生み出されました。

スケーラブルなパフォーマンスによるロードへの対応とは別に、ELT方式にはさらにメリットがあります。例えば、LoadオペレータとUpdateオペレータはUSI (固有セカンダリ インデックス)、JI (結合インデックス)、RI (参照整合性)、あるいはTriggerがあるターゲット テーブルのロードはサポートしていません。しかしELT方式では、まずステージング テーブルにデータをロードして、次にINSERT-SELECTやMERGE-INTOなどのSQL文でそのデータをステージング テーブルからターゲット テーブルに移動することで、そのような制約も回避できます。

ELTを実装するには、次の図に示すように、Teradata PTの「ジョブ ステップ」機能でロード ステップ、SQL INSERT-SELECTステップ、およびクリーンアップ ステップを単一のジョブにカプセル化します。

ジョブ内のステップはいずれも再始動できますが、これは何らかの理由で1つのステップが失敗しても、ジョブを再実行すれば失敗したステップからジョブの実行を再始動でき、そのまま続けて処理ができるという意味です。 ELT方式では、データをターゲット テーブルに挿入するまでに、ジョブ内のさまざまなステップを経て、データ クレンジング、変換、整合性チェックなどさまざまな動作をソース行で実行できる柔軟性があります。

ELT(抽出、ロード、変換)