この例では、元の価格情報とルート平均二乗誤差の評価(RMSE)を比較して、新しい住宅の予測を評価します。
入力
- 入力テーブル: housing_test、DecisionForestPredictの例: 列名の指定と同様です。
- モデル: glm_housing_model、Teradata Vantage™ Machine Learning Engine分析関数リファレンス、B700-4003の「GLM関数例: ガウス分布分析」によって出力される
SQL呼び出し
正規リンクは、ガウス分布の"identity"であるデフォルトのファミリー リンクを指定します。
DROP TABLE glmpredict_housing;
CREATE MULTISET TABLE glmpredict_housing AS (
SELECT * FROM GLMPredict (
ON housing_test PARTITION BY ANY
ON glm_housing_model AS Model DIMENSION
USING
Accumulate ('sn', 'price')
Family ('GAUSSIAN')
LinkFunction ('CANONICAL')
) AS dt
) WITH DATA;
出力
このクエリーは、以下のテーブルを返します。
SELECT * FROM glmpredict_housing ORDER BY 1;
| sn | price | fitted_value |
|---|---|---|
| 13 | 27000 | 3.73458440000000E 004 |
| 16 | 37900 | 4.36871317500000E 004 |
| 25 | 42000 | 4.09020280000000E 004 |
| 38 | 67000 | 7.24876705000000E 004 |
| 53 | 68000 | 7.92386937000000E 004 |
| 104 | 132000 | 1.11528007000000E 005 |
| 111 | 43000 | 3.91028812000000E 004 |
| 117 | 93000 | 6.69369510000000E 004 |
| 132 | 44500 | 4.18198865000000E 004 |
| 140 | 43000 | 4.16117915000000E 004 |
| 142 | 40000 | 4.43941465000000E 004 |
| 157 | 60000 | 6.65712643500000E 004 |
| 161 | 63900 | 6.49009829000000E 004 |
fitted_value列は予測される住宅価格を示します。
平均二乗誤差評価
このクエリーは平均二乗誤差評価(RMSE)を返します:
SELECT SQRT(AVG(POWER(glmpredict_housing.price - glmpredict_housing.fitted_value, 2))) AS RMSE FROM glmpredict_housing;
| rmse |
|---|
| 1.06854695738768E 004 |