The model prediction is shown in the final column ('M' for match, 'U' for no match). The weight of the object pair is shown in the 'weight' column.
id | src_text2 | tar_text | jaro1_sim |
---|---|---|---|
1 | astter | aster | 0.944444444444445 |
2 | fone | phone | 0.783333333333333 |
3 | acquire | acquiesce | 0.841269841269841 |
4 | CCCGGGAACCAACC | CCAGGGAAACCCAC | 0.875457875457875 |
5 | allen | allies | 0.822222222222222 |
6 | angle | angels | 0.877777777777778 |
7 | center | centre | 0.944444444444445 |
8 | cheap | chief | 0.733333333333333 |
9 | circle | circuit | 0.746031746031746 |
10 | debut | debris | 0.7 |
11 | dell | lead | 0.5 |
12 | bear | bear | 1 |
ld1_sim | ngram1_sim | jw1_sim | weight | match_result |
---|---|---|---|---|
0.833333333333333 | 0.8 | 0.961111111111111 | 43.7700274457179 | M |
0.6 | 0.5 | 0.783333333333333 | -43.6001024457943 | U |
0.666666666666667 | 0.5 | 0.904761904761905 | -0.415037499278844 | U |
0.714285714285714 | 0.692307692307692 | 0.9003663003663 | 22.8384590206632 | M |
0.666666666666667 | 0.4 | 0.875555555555556 | -0.415037499278844 | U |
0.666666666666667 | 0.4 | 0.914444444444445 | -0.415037499278844 | U |
0.666666666666667 | 0.6 | 0.966666666666667 | 22.8384590206632 | M |
0.4 | 0.25 | 0.786666666666667 | -43.6001024457943 | U |
0.571428571428571 | 0.5 | 0.847619047619048 | -22.6685340199802 | U |
0.5 | 0.4 | 0.79 | -43.6001024457943 | U |
0.25 | 0 | 0.5 | -43.6001024457943 | U |
1 | 1 | 1 | 43.7700274457179 | M |
In these examples, the predictions are the same for both supervised and unsupervised models.