'jaro' |
ジャロ距離。 |
'jaro_winkler' |
ジャロ-ウィンクラー距離: 完全一致の場合は1、それ以外の場合は0です。この比較型を指定した場合は、係数pの値をconstantによって指定できます。0≤ p ≤ 0.25。デフォルト: p = 0.1 |
'n_gram' |
N-gramの類似度。この比較型を指定する場合は、constantによってNの値を指定できます。デフォルト: N = 2 |
'LD' |
レーベンシュタイン距離: ある文字列から他の文字列への変換に必要な編集の数。編集は個々の文字の挿入、削除、または置換です。 |
'LDWS' |
置換なしのレーベンシュタイン距離: 個々の文字の挿入または削除のみを使用した、ある文字列から他の文字列への変換に必要な編集の数。 |
'OSA' |
最適な文字列の配置距離: ある文字列から他の文字列への変換に必要な編集の数。編集は、文字の挿入、削除、置換、または転置です。部分文字列は1回だけ編集できます。 |
'DL' |
ダムロー-レーベンシュタイン距離: 'OSA'と同様でが、部分文字列を何回でも編集できる点が異なります。 |
'hamming' |
ハミング距離: 同じ長さの文字列では、対応する文字が異なる位置の数(つまり、ある文字列から他の文字列への変換に必要な最小の置換数)。異なる長さの文字列では、-1。 |
'LCS' |
最長共通部分文字列: 両方の文字列に共通する最長の部分文字列の長さ。 |
'jaccard' |
Jaccard係数ベースの比較。 |
'cosine' |
コサインの類似度。 |
'soundexcode' |
英文字列のみ: いずれかの文字列に英文字以外の文字がある場合は-1。それ以外の場合は、soundexコードが同じ場合は1、それ以外の場合は0です。 |