プライマリ インデックスとスキューのある行分散 - Teradata Database - Teradata Vantage NewSQL Engine

Teradata Vantage™ - データベースの管理

Product
Teradata Database
Teradata Vantage NewSQL Engine
Release Number
16.20
Published
2019年3月
Language
日本語
Last Update
2019-10-29
dita:mapPath
ja-JP/tgx1512080410608.ditamap
dita:ditavalPath
ja-JP/tgx1512080410608.ditaval
dita:id
B035-1093
Product Category
Software
Teradata Vantage

PIの行のハッシュ値により、行をAMPのどの場所に保存するかが決まります。通常の環境では、ハッシュ値はノード全体およびノードのAMP全体に均等に分散されます。

インデックスの値の固有度が下がれば下がるほど、AMP間でのテーブル行の分散は不均等になります。テーブルに数千もの単一値のインスタンスを持つNUPIがある場合、そのテーブルはスキュー(行の分散に不均衡が発生)します。

プライマリ インデックスの性能への影響

  • PIの固有度が高ければ高いほど、行ハッシュ値の固有度も高くなります。
  • 行ハッシュ値の固有度が高ければ高いほど、すべてのAMP vprocでデータがより均等に分散されます。データ分散が均等だと、フル テーブル スキャン操作の並列処理の効率が増します。
  • UPIを使用すると、テーブル行がすべてのAMP vprocで最も均等に分散されます。
  • NUPIを使用すると、行の分散の均等性は、列の値の固有度に従います。同じ行ハッシュの行は、同じテーブルのものである場合か、異なるテーブルのものである場合かにかかわりなく、常に同じAMPに入ります。
テーブルにとって最も望ましいPIを突きとめるには、以下の点を検討する必要があります。
  • 更新アクティビティの範囲
  • フル テーブル スキャンの回数
  • PIの定義に対する結合処理
  • 選択列のPIの頻度と、その結果の潜在的なアクセス パス

PIが原因で不均等なデータ分散が発生している場合は、<Teradata Vantage™ データベース設計、B035-1094>に示すプライマリ インデックスのベスト プラクティス設計に従ってプライマリ インデックスを指定し直す必要があります。