サンプル統計と母集団統計の正確性の比較
使用可能なさまざまな方法で収集された統計の正確さがどれくらいかを先験的に比較検討する場合に理解しておかなければならない大事なことは、母集団統計の正確さが必ずどのような形式のサンプル統計よりも高くなるということです。正確さが劣ると思われる方法を使用して収集した統計が、それより高いと思われる正確さで収集した統計と同じくらい良いということは常に起こりえますが、より正確になることは決してありません。
そしてこれも否定できないことですが、最適化ルーチンが最善の問合わせ計画を必ず作成するために、新しい統計の完全セットを収集する必要があるかどうかを先験的に知ることはできません。
各種の方法に関する相対的な正確さのランキング
さまざまな方法で収集した統計の相対的な正確さを比較した推測を、次のランキング リストに示します。
- ほとんどの場合、動的AMPサンプルは残余統計よりも良い。
動的AMPサンプルもディスクからDBDが取得されるたびに再収集されるので、ほぼ常に、残余統計より新しい状態になります。
- 多くの場合、動的全AMPサンプルは動的AMPサンプルよりも優れている。
- 通常は、フル テーブル集団統計がどのサンプル統計よりも良い。
次のテーブルに、これらのランキングを裏付ける詳細を示します。順次ランクが高くなっていることは、収集される統計の正確さが増すことと、見積もりに使用する情報の正確さが増すにつれて最適化ルーチンがよりよい問合わせ計画を生成する可能性もさらに高くなることとを表わしたものです。
収集方法 | 収集する相対経過時間 | 正確さのランク(数字が大きいほど、正確さも高い) | 備考 |
---|---|---|---|
なし。 残余統計の使用 |
なし。 | 1 |
|
動的AMPサンプル | ほとんどなし。 | 2 |
|
全AMPサンプル | フル テーブル スキャンを実行したときの約5パーセントの時間。 データにひずみがあると、システムがそのサンプル サイズをどれだけ動的に増やすかに応じて、この比率はより大きくなる。 |
3 |
|
フル テーブル スキャン | サンプル統計を実行する時間の約195パーセント。 | 4 |
|