この例では、元の価格情報とルート平均二乗誤差の評価(RMSE)を比較して、新しい住宅の予測を評価します。
入力
- 入力テーブル: housing_test、DecisionForestPredictの例と同様です。
- モデル: glm_housing_model、Teradata Vantage™ Machine Learning Engine分析関数リファレンス、B700-4003の「GLM関数例: ガウス分布分析」によって出力される
SQL呼び出し
正規リンクは、ガウス分布の"identity"であるデフォルトのファミリー リンクを指定します。
DROP TABLE glmpredict_housing; CREATE MULTISET TABLE glmpredict_housing AS ( SELECT * FROM GLMPredict ( ON housing_test PARTITION BY ANY ON glm_housing_model AS Model DIMENSION USING Accumulate ('sn', 'price') Family ('GAUSSIAN') LinkFunction ('CANONICAL') ) AS dt ) WITH DATA;
出力
このクエリーは、以下のテーブルを返します。
SELECT * FROM glmpredict_housing ORDER BY 1;
sn | price | fitted_value |
---|---|---|
13 | 27000 | 3.73458440000000E 004 |
16 | 37900 | 4.36871317500000E 004 |
25 | 42000 | 4.09020280000000E 004 |
38 | 67000 | 7.24876705000000E 004 |
53 | 68000 | 7.92386937000000E 004 |
104 | 132000 | 1.11528007000000E 005 |
111 | 43000 | 3.91028812000000E 004 |
117 | 93000 | 6.69369510000000E 004 |
132 | 44500 | 4.18198865000000E 004 |
140 | 43000 | 4.16117915000000E 004 |
142 | 40000 | 4.43941465000000E 004 |
157 | 60000 | 6.65712643500000E 004 |
161 | 63900 | 6.49009829000000E 004 |
fitted_value列は予測される住宅価格を示します。
平均二乗誤差評価
このクエリーは平均二乗誤差評価(RMSE)を返します:
SELECT SQRT(AVG(POWER(glmpredict_housing.price - glmpredict_housing.fitted_value, 2))) AS RMSE FROM glmpredict_housing;
rmse |
---|
1.06854695738768E 004 |