16.20 - GLMPredict例2: ガウス分布予測 - Teradata Vantage NewSQL Engine

Teradata Vantage™ - NewSQL Engineの分析関数

prodname
Teradata Database
Teradata Vantage NewSQL Engine
vrm_release
16.20
category
プログラミング リファレンス
featnum
B035-1206-162K-JPN

この例では、元の価格情報とルート平均二乗誤差の評価(RMSE)を比較して、新しい住宅の予測を評価します。

入力

  • 入力テーブル: housing_test、DecisionForestPredictの例と同様です。
  • モデル: glm_housing_model、ML Engine GLM関数の例3で出力されます。

SQL呼び出し

正規リンクは、ガウス分布の"identity"であるデフォルトのファミリー リンクを指定します。

DROP TABLE glmpredict_housing;

CREATE MULTISET TABLE glmpredict_housing AS (
  SELECT * FROM GLMPredict (
    ON housing_test PARTITION BY ANY
    ON glm_housing_model AS Model DIMENSION
      ORDER BY attribute, category, predictor, estimate
    USING
    Accumulate ('sn', 'price')
    Family ('GAUSSIAN')
    LinkFunction ('CANONICAL')
  ) AS dt
) WITH DATA;

出力

このクエリーは、以下のテーブルを返します。

SELECT * FROM glmpredict_housing ORDER BY 1;
sn price fitted_value
13 27000 3.73458440000000E 004
16 37900 4.36871317500000E 004
25 42000 4.09020280000000E 004
38 67000 7.24876705000000E 004
53 68000 7.92386937000000E 004
104 132000 1.11528007000000E 005
111 43000 3.91028812000000E 004
117 93000 6.69369510000000E 004
132 44500 4.18198865000000E 004
140 43000 4.16117915000000E 004
142 40000 4.43941465000000E 004
157 60000 6.65712643500000E 004
161 63900 6.49009829000000E 004

fitted_value列は予測される住宅価格を示します。

平均二乗誤差評価

このクエリーは平均二乗誤差評価(RMSE)を返します:
SELECT SQRT(AVG(POWER(glmpredict_housing.price - glmpredict_housing.fitted_value, 2))) AS RMSE FROM glmpredict_housing;
rmse
1.06854695738768E 004