Gruppo corrispondenza fuzzy↵
Abstract
Questo gruppo contiene funzioni per confronti fuzzy fra valori.
hamming_distance↵
Restituisce la distanza di Hamming tra due stringhe. Questa equivale al numero di caratteri nelle corrispondenti posizioni delle stringhe in ingresso dove i caratteri sono diversi. Le stringhe in ingresso devono avere la stessa lunghezza, e il confronto è sensibile alle lettere maiuscole.
Sintassi:
- hamming_distance(string1, string2)
Argomenti:
- string1 una stringa
- string2 una stringa
Esempi:
hamming_distance('abc','xec') → 2
hamming_distance('abc','ABc') → 2
hamming_distance(upper('abc'),upper('ABC')) → 0
levenshtein↵
Restituisce la distanza di Levenshtein tra due stringhe. Questa equivale al minimo numero di modifiche di caratterere (inserimenti, cancellazioni o sostituzione) richieste per cambiare una stringa in un'altra. La distanza di Levenshtein è una misura della somiglianza tra due stringhe. Distanze più piccole corrispondono a stringhe più simili, e distanze più grandi corrispondono a stringhe più differenti. La distanza è sensibile alle lettere maiuscole.
Sintassi:
- levenshtein(string1, string2)
Argomenti:
- string1 una stringa
- string2 una stringa
Esempi:
levenshtein('kittens','mitten') → 2
levenshtein('Kitten','kitten') → 1
levenshtein(upper('Kitten'),upper('kitten')) → 0
longest_common_substring↵
Restituisce la sottostringa in comune più lunga tra due stringhe. Questa sottostringa è la stringa più lunga che è una sottostringa delle due stringhe in ingresso. Es: la sottostringa in comune più lunga di "ABABC" e "BABCA" è "ABC". La sottostringa è sensibile alle lettere maiuscole
Sintassi:
- longest_common_substring(string1, string2)
Argomenti:
- string1 una stringa
- string2 una stringa
Esempi:
longest_common_substring('ABABC','BABCA') → 'ABC'
longest_common_substring('abcDeF','abcdef') → 'abc'
longest_common_substring(upper('abcDeF'),upper('abcdex')) → 'ABCDE'
soundex↵
Restituisce la rappresentazione Soundex di una stringa. Soundex è un algoritmo di abbinamento fonetico, per cui le stringhe con suoni simili dovrebbero essere rappresentate dallo stesso codice Soundex.
Sintassi:
- soundex(string)
Argomenti:
- string una stringa
Esempi:
soundex('robert') → 'R163'
soundex('rupert') → 'R163'
soundex('rubin') → 'R150'
secondo questo algoritmo Sicilia bedda e Sicilia bella hanno stesso suono