INSERT ...SELECTリクエストの最適化 - Advanced SQL Engine

INSERT ...SELECTリクエストの最適化 - Advanced SQL Engine - Teradata Database

Teradata Vantage™ - SQLデータ操作言語

Product

Advanced SQL Engine

Teradata Database

Release Number

17.10

Published

2021年7月

Language

日本語

Last Update

2021-09-23

dita:mapPath

ja-JP/vjt1596846980081.ditamap

dita:ditavalPath

ja-JP/wrg1590696035526.ditaval

dita:id

B035-1146

Product Category

Software

Teradata Vantage

空のテーブルへのINSERT ... SELECTリクエストとパフォーマンス

INSERT...SELECTは、ターゲットテーブルが空である場合にパフォーマンスが最適化されます。ターゲットテーブルにデータが入っていない場合、INSERT...SELECTはジャーナリングをバイパスしてブロックごとに効率的に実行します。

通常、システムでテーブルに行が挿入されるとき、対応するエントリがトランザクションジャーナル(TJ)に作成されて、トランザクションがアボートした場合に行をロールバックできるようになります。

空でないテーブルに挿入する場合、トランザクションがアボートすると、システムではTJで行ID(トランザクション関連のRowID)が検索され、テーブルからすべての挿入項目が1行ずつ削除されます。
空のテーブルに挿入する場合、トランザクションがアボートすると、すべての行が削除されることにより、そのテーブルは簡単に最初の状態に復元されます。

最適化されたINSERT . . . SELECTを使用することには、以下の利点があります。

ブロック単位の処理
ブロック併合の複雑な処理がない、より高速な挿入ロジック
アボートしたINSERT ... SELECTに対する即時のロールバック。

例: INSERT ... SELECT

複数の「Regional Sales History」テーブルを使用して、異なる地域のサマリーを結合することにより、単一のサマリーテーブルを作成します。次に、複文INSERT ... SELECT文を使用して、これらのサマリーを単一テーブルに挿入します。

すべての複文INSERT ... SELECT文は、同じスプールテーブルに出力します。出力はソートされて、以下に示すように空のテーブルに挿入されます。

複文リクエストは、以下のようにBTEQ内にセミコロンを入れるか、または単一のマクロ内に複数の文を入れることによって作成します。

各文を個別のリクエストとして実行すると、最初の文だけが空のテーブルに挿入されます。

  INSERT into Summary_Table
  SELECT store, region,sum(sales),count(sale_item)
  FROM Region_1
  GROUP BY  1,2
  ;INSERT into Summary_Table
  SELECT region2, sum (sales), count(sale_item)
  FROM Region_2
  GROUP BY     1,2
      . . .
  ;INSERT into   Summary_Table
  SELECT region3, sum(sales), count(sale_item)
  FROM Region_N
  GROUP BY     1,2;

空のSETテーブルへのINSERT ... SELECT

重複行がないことが分かっているソースから空のSETテーブルにINSERT ... SELECTを実行すると、挿入中に行なわれるターゲットテーブルの重複検査がなくなります。これは、別のSETテーブルから直接挿入する場合にも生じます。

NUPIが相対的に非固有であるか、または非常に非固有度の高い値がほとんどない場合、この方法によりパフォーマンスが大幅に改善されます。

INSERT ... SELECTとFastLoad

FastLoadデータ操作のため、最適化されたINSERT ... SELECTを使用します。

ステージングテーブルへのFastLoadを実行する。
必要に応じてデータを操作し、最終テーブルへINSERT ... SELECTする。

FastLoadとINSERT ... SELECTはINMODを使用するよりも高速にホスト上のデータを管理します。これは、ホストが単一のボトルネックであるのに対し、並列AMPはレポートや中間結果のための一時テーブルを配置するためです。

複数のソーステーブルから同じターゲットテーブルに挿入することができます。リクエストが開始される前のターゲットテーブルが空の場合、そのリクエスト内のすべてのINSERT ... SELECT文は最適化されたモードで実行されます。

ステージングテーブルは、プライマリインデックスなしのNoPI(プライマリインデックスなし)テーブルにできます。NoPIテーブルでは、ステージングテーブルのように行がハッシュ化されて配置されません。FastLoadの速度は、NoPIテーブルに挿入する場合のほうが速くなります。これは、ソートや行の再配置が必要ないためです。行は単純に、すべてのAMP間で均等にテーブルに追加されます。

NoPIは、プライマリインデックスを持たない中間テーブル内でのスキューを減らし、ステージングテーブルにおいて便利です。ただし、NoPIテーブルの行はハッシュに基づいていないため、NoPIテーブルからPIテーブルへのINSERT ... SELECTは、テーブル内で同じPI定義を共有するINSERT ... SELECTより遅くなります。中間テーブルを多く生成するBIツールやアプリケーションでNoPIテーブルの使用を検討してください。

INSERT ...SELECTをNoPIテーブルからPIテーブルに対して実行する場合、INSERT ...SELECTを同じ PIのPI テーブルからPIテーブルに対して実行する場合に比べて遅くなる可能性があります。

INSERT ... SELECTと結合インデックス

結合インデックスを持つテーブルに対して挿入処理を行なう最速の方法は、以下のとおりです。

FastLoadを使用してインデックスまたは結合インデックスが1つも定義されていないステージングテーブルに行をロードする
ステージングテーブルから結合インデックスのあるターゲットテーブルにINSERT ...SELECTする。

ターゲットテーブルに複数の結合インデックスが定義されている場合、最適化ルーチンでは、結合インデックスの保守に際して再利用可能なスプールが使用されることがあります。