FellegiSunterPredict Example 2: Supervised Learning Model - Teradata Vantage

Machine Learning Engine Analytic Function Reference

Product
Teradata Vantage
Release Number
8.00
1.0
Published
May 2019
Language
English (United States)
Last Update
2019-11-22
dita:mapPath
blj1506016597986.ditamap
dita:ditavalPath
blj1506016597986.ditaval
dita:id
B700-4003
lifecycle
previous
Product Category
Teradata Vantage™

Input

SQL Call

SELECT * FROM FellegiSunterPredict (
  ON fspredict_input PARTITION BY ANY
  ON fg_supervised_model AS model DIMENSION
  USING
  Accumulate ('id', 'src_text2', 'tar_text', 'jaro1_sim',
              'ld1_sim','ngram1_sim', 'jw1_sim')
) AS dt ORDER BY id;

Output

The final column, match_result, contains the model prediction—M for match, U for no match. The weight column contains the weight of the object pair.

id src_text2 tar_text jaro1_sim ld1_sim ngram1_sim jw1_sim weight match_result
1 astter aster 0.944444444444445 0.833333333333333 0.8 0.961111111111111 43.7700274457179 M
2 fone phone 0.783333333333333 0.6 0.5 0.783333333333333 -43.6001024457943 U
3 acquire acquiesce 0.841269841269841 0.666666666666667 0.5 0.904761904761905 -0.415037499278844 U
4 CCCGGGAACCAACC CCAGGGAAACCCAC 0.875457875457875 0.714285714285714 0.692307692307692 0.9003663003663 22.8384590206632 M
5 allen allies 0.822222222222222 0.666666666666667 0.4 0.875555555555556 -0.415037499278844 U
6 angle angels 0.877777777777778 0.666666666666667 0.4 0.914444444444445 -0.415037499278844 U
7 center centre 0.944444444444445 0.666666666666667 0.6 0.966666666666667 22.8384590206632 M
8 cheap chief 0.733333333333333 0.4 0.25 0.786666666666667 -43.6001024457943 U
9 circle circuit 0.746031746031746 0.571428571428571 0.5 0.847619047619048 -22.6685340199802 U
10 debut debris 0.7 0.5 0.4 0.79 -43.6001024457943 U
11 dell lead 0.5 0.25 0 0.5 -43.6001024457943 U
12 bear bear 1 1 1 1 43.7700274457179 M