Input
- Input table: fspredict_input, as in FellegiSunterPredict Example 1: Unsupervised Learning Model
- Model table: fg_supervised_model, output by FellegiSunter Example 2: Supervised Learning
SQL Call
SELECT * FROM FellegiSunterPredict ( ON fspredict_input PARTITION BY ANY ON fg_supervised_model AS model DIMENSION USING Accumulate ('id', 'src_text2', 'tar_text', 'jaro1_sim', 'ld1_sim','ngram1_sim', 'jw1_sim') ) AS dt ORDER BY id;
Output
The final column, match_result, contains the model prediction—M for match, U for no match. The weight column contains the weight of the object pair.
id | src_text2 | tar_text | jaro1_sim | ld1_sim | ngram1_sim | jw1_sim | weight | match_result |
---|---|---|---|---|---|---|---|---|
1 | astter | aster | 0.944444444444445 | 0.833333333333333 | 0.8 | 0.961111111111111 | 43.7700274457179 | M |
2 | fone | phone | 0.783333333333333 | 0.6 | 0.5 | 0.783333333333333 | -43.6001024457943 | U |
3 | acquire | acquiesce | 0.841269841269841 | 0.666666666666667 | 0.5 | 0.904761904761905 | -0.415037499278844 | U |
4 | CCCGGGAACCAACC | CCAGGGAAACCCAC | 0.875457875457875 | 0.714285714285714 | 0.692307692307692 | 0.9003663003663 | 22.8384590206632 | M |
5 | allen | allies | 0.822222222222222 | 0.666666666666667 | 0.4 | 0.875555555555556 | -0.415037499278844 | U |
6 | angle | angels | 0.877777777777778 | 0.666666666666667 | 0.4 | 0.914444444444445 | -0.415037499278844 | U |
7 | center | centre | 0.944444444444445 | 0.666666666666667 | 0.6 | 0.966666666666667 | 22.8384590206632 | M |
8 | cheap | chief | 0.733333333333333 | 0.4 | 0.25 | 0.786666666666667 | -43.6001024457943 | U |
9 | circle | circuit | 0.746031746031746 | 0.571428571428571 | 0.5 | 0.847619047619048 | -22.6685340199802 | U |
10 | debut | debris | 0.7 | 0.5 | 0.4 | 0.79 | -43.6001024457943 | U |
11 | dell | lead | 0.5 | 0.25 | 0 | 0.5 | -43.6001024457943 | U |
12 | bear | bear | 1 | 1 | 1 | 1 | 43.7700274457179 | M |