Bonjour,
L’API de géocodage disponible sur adresse.data.gouv.fr va prochainement évoluer vers une nouvelle version d’addok, notre moteur de géocodage.
Nous prévoyons de mettre en production cette nouvelle version à la fin du mois.
Comme pour la précédente mise à jour, nous avons mis en place l’adresse devapi-adresse.data.gouv.fr (au lieu de api-adresse.data.gouv.fr) pour vous permettre d’effectuer des tests.
Exemple: http://devapi-adresse.data.gouv.fr/search?q=20+av+segur+paris
Les principaux changements concernent l’algorithme de classement des adresses trouvées (donc le « score » retourné par l’API).
Ce scoring est beaucoup plus rapide et apporte un gain de l’ordre de 30 à 40% en moyenne sur les temps de géocodage.
Les autres nouveautés:
-
des améliorations dans l’algo de recherche
- il peut désormais éliminer jusqu’à deux mots formant un bruit potentiel pour élargir la recherche, ex: « Quai Jules Verne St Cyprie Plage »
- corrections de petits bugs ou défaut de logique (par exemple un comportement plus cohérent entre version avec et sans autocomplétion)
-
un nouvel algorithme de scoring
- en moyenne 5 fois plus plus rapide (principale source d’amélioration des temps de réponse)
- le score prend essentiellement en compte la portion du texte cherché présente dans l’adresse du référentiel + un peu de levenshtein pour tenir compte de l’ordre (gère mieux les cas comme « Avenue de Paris Saint-Mandé » / « Avenue de Saint Mande Paris »)
- le score est mieux ajusté en cas de préférence géographique (lat/lon) en réduisant la valeur « importance »
-
un meilleur nettoyage des adresses soumises au géocodage
- suppression étendue des mentions postales (BP, CS, TSA, CIDEX)
- traitement spécifique pour les CEDEX, dans ce cas on ne garde que le début du code postal
- suppression des numéros de téléphone/fax (et oui, on en retrouve dans les logs !)
- concaténation des initiales de sigles (S N C F > SNCF, F F I > FFI)
-
ajout d’un log pour les requêtes lentes
Nous vous remercions d’avance pour les anomalies liées au fonctionnement du géocodeur que vous pouvez signaler sur https://github.com/addok/addok/issues
Bon tests !