public marks

PUBLIC MARKS from parmentierf with tags algorithme & recherche

June 2007

Double Metaphone - Wikipédia

(via)
Le Double Metaphone est un algorithme de recherche phonétique écrit par Lawrence Philips et est la deuxième génération de l'algorithme Metaphone. Son implémentation a été décrite en juin 2000 dans le magazine C/C Users Journal. Il est appelé « Double » car il peut retourner un code primaire et secondaire pour une chaîne de caractères (String) ; cela compte pour des cas ambigus ou pour des variantes multiples avec des ascendances communes. Par exemple, l'encodage du nom « Smith » rapporte le code primaire SM0 et le code secondaire XMT, lorsque le nom « Schmidt » rapporte le code primaire XMT et le code secondaire de SMT ; les deux ont XMT en commun.

September 2005

Les SOUNDEX

by 1 other (via)
Comment dans une liste de nom de personne arriver à retrouver un certain DUPONT ou DUPOND ou DUPAN ou encore DEPAIN ??? C’est simple, il suffit de se baser sur la consonance et non sur les mots eux-mêmes. Tous les algorithmes de Soundex reposent sur un principe de base qui consiste à codifier le mot en éliminant les lettres en doubles, les lettres muettes (H en particulier) et en rapprochant les sons de certaines lettres. Une fois cette codification obtenue on la stocke auprès de la donnée de base et on effectue la recherche par comparaison directe entre le Soundex ainsi obtenu et le mot recherché codifié lui aussi en Soundex. La recherche en est donc très performante puisqu’elle aboutit à une requête dont le critère est l’égalité, et pour peu que l’on place un index sur le champ qui stocke le code du soundex, alors elle s’avère aussi rapide que de trouver un enregistrement pas sa clef.

parmentierf's TAGS related to tag algorithme

blog +   c +   dev +   dictionnaire +   français +   guide +   intelligence artificielle +   java +   jeu +   logiciel +   lsa +   moteur de recherche +   phonétique +   python +   recherche +   sémantique +   string matching +   taln +   text/processing +   thèse +   visualisation +   web +   xhtml +