次の処理は、Soundexのコード化の指針の概要を示しています。
- 名前の先頭の文字を残す。
- 他の場所に以下の文字が現われる場合、それをすべて削除する。
A, E, I, O, U, Y, H, W
in other positions。
- 残った文字(先頭の文字を除く)に次の数字を割り当てる。
1 = B, F, P, V
2 = C, G, J, K, Q, S X, Z
3 = D, T
4 = L
5 = M, N
6 = R
- 元の名前でコードが同一の文字が2つ以上連続している場合、またはHまたはWを間にはさんで連続している場合は、最初の文字だけ残して残りは省略する。
- 3つの数字に満たない場合は末尾にゼロを追加して、「文字、数字、数字、数字」の形式に変換する。
- 数字が3つを超える場合は右端の数字を削除する。
- 名前の中の隣接する文字が同じ数字に相当する場合、1つの数字によって1文字としてコード化される。
姓の敬称は一般に使用されません。