17.00 - 17.05 - 完全統計とサンプル統計の比較 - Advanced SQL Engine - Teradata Database

Teradata Vantage™ - SQLデータ定義言語 詳細トピック

Product
Advanced SQL Engine
Teradata Database
Release Number
17.00
17.05
Release Date
2020年6月
Content Type
プログラミング リファレンス
Publication ID
B035-1184-170K-JPN
Language
日本語 (日本)

以下に表では、COLLECT STATISTICS (最適化ルーチン形式)を使用して統計を収集する2つの方法を比較し、最も生産的な使用法を紹介しています。

統計の収集と再収集のしきい値を指定できることによって、これらの問題が最小化されます。

メソッド 特性 最良の使用法
完全統計
  • すべてのデータのすべての統計を収集する。
  • 時間がかかる。
  • 3種類の統計収集方式で一番正確である。
  • データ ディクショナリの間隔ヒストグラムに格納する。
  • データ値に特にばらつきがあるインデックスや列に対して最良の選択である。
  • 小規模のテーブル(AMPあたり1,000行以下の小さなテーブル)に対して推奨する。
  • 固有値が中程度から少数ある選択列に対して推奨する。
  • 大半のNUSIと別の選択列に対して推奨する。

    NUSIの収集時間は非常に高速である。

  • 次に示す状態のすべての列セットまたはインデックス列セットに対して推奨する。

    完全統計が値を追加する。

    サンプリングでは満足な統計見積もりが提供されない。

ユーザー指定のサンプル統計
  • カーディナリティの見積もりではなく、データのサンプルの、すべての統計を収集する。
  • 完全統計より収集時間が非常に高速である。
  • データ ディクショナリの間隔ヒストグラムに格納する。
  • 特に共通点の少ない(つまり、固有値の数がテーブルのカーディナリティに匹敵する)インデックスや列に対して使用可能である。
  • 固有な列、固有なインデックスおよび特に共通点の少ないインデックスや列に対して推奨する。

    サンプル統計は大規模テーブル(数100億行あるテーブルなど)で役に立つ。

  • 小規模テーブル(つまり、カーディナリティがシステムのAMP数の20倍を超えないテーブル)では使用しない