Interprétation du score

Bonjour
je recherche des informations sur le score retournée par le geocodeur (de0 à 1). Comment est il calculé?

Quelques éléments de réponse sur:


Bonjour
Merci beaucoup pour cette réponse rapide.
J’utilise la BAN pour normaliser un fichier d’adresse. Je n’utilise pas le geocodage.
Je constate sur mon fichier que dans la grande majorité des cas, l’outil me propose un résultat (98% des cas).
Dès lors le score est un élément important pour apprécier le résultat et effectivement, en dessous de 50% il y a en général une grosse diférence entre l’adresse d’origine et l’adresse retournée.
J’imaginais que le score était calculé sur le nombre de caractère commun couplé à leur ordre ou quelques chose comme ça…
Exemple de score très bas (0.31)
25 RUE LEON BILLIET 62176 ETAPLES
renvoie
Route d’Étaples 62176 Camiers

Cette API n’a pas été conçue pour faire de la normalisation d’adresses, même si elle peut servir à ce type d’usage.

Son but initial est plutôt orienté auto-complétion d’adresses, donc avec une interaction humaine.

Il est difficile de donner une limite précise à partir de laquelle on peut être sûr que l’adresse trouvée correspond à celle que l’on avait en entrée. Ceci dépend de la qualité des adresses initiales, mais aussi des paramètres de recherche.

Exemples:

  • si vous avez des adresses « complètes », il faut désactiver l’autocomplétion qui va tenter de compléter le dernier mot (autocomplete=0)
  • si vous avez un code INSEE correspondant à la commune, utilisez-le en filtre (citycode=NNNNN) pour restreindre la recherche uniquement dans cette commune (dans ce cas, n’indiquez pas le code postal ni le nom de la commune/bureau distributeur)

Dans votre exemple, j’obtiens bien la bonne adresse, bien que le code postal soit incorrect: http://api-adresse.data.gouv.fr/search/?autocomplete=0&q=25+RUE+LEON+BILLIET+62176+ETAPLES avec un score de 0.75

La BAN ne contient que les code postaux normaux, pas ceux correspondants au CEDEX et distributions spéciales (CS, BP, TSA, etc)

Ce code postal spécial est donc assimilé à du bruit, si on le retire, le score passe à 0.92

Si on passe le code INSEE de la commune, sans code postal ou nom de commune, on a une seule réponse (normal): http://api-adresse.data.gouv.fr/search/?autocomplete=0&citycode=62318&q=25+RUE+LEON+BILLIET

2 J'aime

Encore merci beaucoup pour ces précisions.
J’ai une dernière question, l’algo qui tourne derrière l’api est il identique à celui du moteur csv en ligne?

Oui, identique, avec juste l’option autocomplete=0 par défaut vu qu’on n’est pas en cours de saisie d’une adresse.