ランダム サンプリング
Teradata Databaseでは、SAMPLE句を使用してデータベース テーブルからランダム サンプルを抽出し、次のいずれかを指定できます。
- 行数
- 行の総数の分割率
- 標本としての比率の集合
このサンプリング方式では、行が置換なしで抽出され、母集団から別のサンプルを取り出す際には前のサンプルが再び考慮されることがないということが前提になっています。この方法の場合、複数のサンプルを要求して抽出されるサンプルは、互いに排他的なものになります。さらに、ランダム サンプリング方式では、システム内のAMPに関して行の比例割振りが前提にされています。
無作為層化サンプリング
Teradata Databaseでは、ランダム サンプリング方式に加えて、層化サンプリングがサポートされています。
層化サンプリング抽出法(比例抽出法または割当て無作為抽出法)では、母集団をいくつかの同質なサブグループに分割し、各サブグループから無作為に標本を抽出します。層化サンプリングでは、母集団全体と、母集団の主要サブグループの両方が表現されることになります。層化サンプリングの分割率指定とは、階層内の総行数の分割率のことです。
層化サンプリングには、次のことが適用されます。
指定できる | 指定できない |
---|---|
派生テーブル、ビュー、およびマクロの中での層化サンプリング | 集合演算またはサブクエリーによる層化サンプリング |
各階層の標本サイズとしての小数または整数 | 小数と整数の組合わせ |
階層ごとに16個までの相互排他的標本 |