17.05 - サンプリング方式 - Advanced SQL Engine - Teradata Database

Teradata Vantage™ - SQLデータ操作言語

Product
Advanced SQL Engine
Teradata Database
Release Number
17.05
Release Date
2021年1月
Content Type
プログラミング リファレンス
Publication ID
B035-1146-175K-JPN
Language
日本語 (日本)

ランダム サンプリング

Vantageでは、SAMPLE句を使用してデータベース テーブルからランダム サンプルを抽出し、次のいずれかを指定できます。
  • 行数
  • 行の総数の分割率
  • 標本としての比率の集合

このサンプリング方式では、行が置換なしで抽出され、母集団から別のサンプルを取り出す際には前のサンプルが再び考慮されることがないということが前提になっています。この方法の場合、複数のサンプルを要求して抽出されるサンプルは、互いに排他的なものになります。さらに、ランダム サンプリング方式では、システム内のAMPに関して行の比例割振りが前提にされています。

無作為層化サンプリング

Vantageでは、ランダム サンプリング方式に加えて、層化サンプリングがサポートされています。

層化サンプリング抽出法(比例抽出法または割当て無作為抽出法)では、母集団をいくつかの同質なサブグループに分割し、各サブグループから無作為に標本を抽出します。層化サンプリングでは、母集団全体と、母集団の主要サブグループの両方が表現されることになります。層化サンプリングの分割率指定とは、階層内の総行数の分割率のことです。

層化サンプリングには、次のことが適用されます。

指定できる 指定できない
派生テーブル、ビュー、およびマクロの中での層化サンプリング 集合演算またはサブクエリーによる層化サンプリング
各階層の標本サイズとしての小数または整数 小数と整数の組合わせ
階層ごとに16個までの相互排他的標本