Concours dataviz MEEM Presticides > les données

Le ministère de l’environnement organise un premier concours de data-visualisation.

En réponse aux engagements pris lors du Sommet de la Terre de Rio de 1992, la France a fait de l’information environnementale un axe prioritaire. Le ministère de l’environnement diffuse régulièrement des informations sur les enjeux liés à la transition écologique, et en particulier sur l’état des milieux et de la biodiversité et sur l’exposition aux risques et nuisances. Ces informations portent notamment sur la contamination des milieux aquatiques, dont la pollution des eaux souterraines par les pesticides.

Par ce concours, le ministère souhaite favoriser une meilleure appropriation, par les citoyens, des informations relatives aux pesticides dans les eaux souterraines grâce à une solution de data-visualisation innovante et pédagogique.

Le concours se déroule du 15 décembre 2016 au 16 février 2017.
Pour plus de détails, consultez la page web dédiée sur le site du MEEM.

Les prix : des places pour les incubateurs du ministère, en particulier celui d’Orléans, mais également des prix : 6000 euros pour le premier lauréat, 3000 pour le deuxième et 1000 pour le troisième.

Préparez-vous…
…et inscrivez-vous !!

Bonjour,

J’ai l’impression qu’une coquille s’est glissée dans les versions CSV des jeux de données mis à disposition : les concentrations en pesticides sont toujours à zéro comme si elles avaient toutes été arrondies, alors que dans les jeux de données en version Excel, les valeurs semblent correctes.

bonjour, effectivement, il y a une erreur dans le fichier « Historique 2007 » au format CSV. C’est le séparateur de décimal qui n’est pas adapté : « 0.1 » à la place de « 0,1 ».

bonjour,

Comment ce fait il qu’un Code sandre est référencé plusieurs fois sous différents libellés ?
fichier Pesticide

ex :1177 , 1208 …

comment lier les historiques entre station et pesticide lorsque nous avons des doublons des codes Sandre dans la table Pesticide ?

Il y a aussi un code 2 pour le Mefluidide alors qu’il est aussi référencé sous le code 2558 Méfluidide (avec un accent).

merci

Pour info, il semblerait qu’une autre coquille se soit glissée dans les fichiers ma_qp_fm_ttres_pesteso_xx.CSV dans le cas des Code de station : les codes stations contenants un « . » ont été traduite en « , »

Bonjour,

quelle est la licence de ces données ? Disposent-elles de métadonnées ? Sont-elles aussi sur data.gouv.fr ?

Merci

@hugoroussaffa, oui en effet j’ai remarqué aussi les 3 doublons de codes dans le référentiel des pesticides : 1141, 1177 et 1208, mais les libellés, codes familles, etc sont à peu près similaires on peut donc penser qu’il s’agit des mêmes pesticides pour chaque doublon. Il n’y a pas de doublons sur le référentiel des stations par contre.

Bonjour,

J’aurais une question concernant le fichier de fond de carte des masses d’eau : PolygMasseDEauSouterraine.shp.

Le descriptif pdf est informatif, il y a des infos complémentaires ici et sur sandre.eaufrance.fr /urn.php?urn=urn:sandre:dictionnaire:MDO::entite:MasseDEauSouterraine:ressource:latest:::html (dsl pour la typo, pas plus de 2 liens par message pour les nouveaux inscrits comme moi)

… mais où pourrait-on trouver les explications sur l’ensemble des intitulés de colonnes et à quoi correspondent les valeurs, bref un dictionnaire/descriptif du shp comme il y a pour les données de mesures ? en particulier sur les intitulés les plus obscurs pour les non-spécialistes :

par ex : index ‹ Niveau › --> « 1 » ==? quel niveau de profondeur en mètres ?

et les autres qui sont peu « self-explinatory » :
‹ FrangeLitt › / ‹ Karstique › / ‹ MasseDEauA › / ‹ MasseDEauT › / ‹ NatureEcou › / ‹ NomMasseDE › / ‹ PrecSupMas › / ‹ Regroupees › / ‹ StMasseDEa › / ‹ SurfaceAff › / ‹ SurfaceSsC › / ‹ SurfaceTot › / ‹ SystemeRef › / ‹ TypeMasseD ›

PS : j’ai tenté de faire une recherche ici, par exemple : requête_AG001_sur_site_SANDRE mais quand on clique sur XML, JSON, fiche pas de données affichées ou erreur système.

bonsoir,
dans le cadre du concours, il peut être considéré que les doublons correspondent à la même substance, y compris pour les codes 2 et 2568.
par ailleurs, après vérification dans les fichiers CSV, il n’y a pas eu de transformation de « . » en « , ».

bonsoir @samgoeta
Le descriptif des données figure dans les fichiers proposés au téléchargement. Par ailleurs, des informations complémentaires sont également dans le règlement du concours.
Les données ne sont effectivement pas sur data.gouv.fr ; c’est un sujet à voir après le concours.
Les données brutes qui ont permis de calculer les concentrations moyennes sont disponibles sur la base de données ADES (ceci est précisé dans le règlement du concours).
Voilà j’espère que cela précise les choses. :+1:

Bonjour @Jpy

Pour compléter la documentation, ci-joint un document décrivant les couches pour les masses d’eau.Concours Datavisualisation Pesticides - description_masses d-eau souterraines.ods (14,3 Ko)

Bon courage

Bonjour @strainel,

Dans certaines documentations sur les pesticides comme celui-ci , on y parle des stations de prélèvement présentes dans les DOM/TOM. Mais dans les fichiers fournis (référentiels des stations et données de 2007 à 2012), il n’y a à priori rien pour les DOM/TOM, c’est normal ?

Bonjour @strainel,

J’aimerais clarifier un point concernant le fichier « Descriptif fichiers ma_qp_fm_ttres_pesteso_XX ».
Les analyses non quantifiées concernent-elles les analyses pour lesquelles le pesticide recherché n’a pas été détecté par le laboratoire ? Dans ce cas, toutes les analyses donnant un résultat négatif sont considérées comme non quantifiées ?
Ou cela concerne uniquement les analyses pour lesquelles le pesticide recherché a été détecté mais où il n’a pas pu être quantifié ? Et cela à cause des limites de quantification de l’appareil utilisé.

Bonjour @strainel,

Il y a quelque chose que je ne comprends pas dans les données.

Dans les fichiers fournis, nous avons d’une part les concentrations moyennes par station, pesticide et année (fichiers dans « Moyennes_analyses_pesticides dans eaux souterraines_HISTORIQUE ») ; et d’autre part les concentrations moyennes totales par station et année (fichiers dans « Moyenne concentrations totale pesticides dans eaux souterraines »).

J’ai peu être manqué quelque chose dans les metadonnées, mais si je comprends bien, pour une station et une année donnée, la somme des concentrations moyennes des différents pesticides est censée nous donner la moyenne annuelle de la concentration totale en pesticides ?

Quelques exemples :

En 2012, pour la station 00501x0045/S, on a les concentrations suivantes :

Station Pesticide Concentration
00501X0045/S 1107 0,015
00501X0045/S 1108 0,015
00501X0045/S 1109 0,025
00501X0045/S 1136 0,015
00501X0045/S 1177 0,015
00501X0045/S 1208 0,015
00501X0045/S 1209 0,025
00501X0045/S 1263 0,015
00501X0045/S 1266 0,015
00501X0045/S 1268 0,015
00501X0045/S 2045 0,015
00501X0045/S 2051 0,025

Hors, dans le fichier des moyennes annuelles de concentrations totales, cette station a pour valeur « 0 », ce qui me semble pas très cohérent …

Autre exemple pour la station 03468x0051/P1 en 2012. Si je somme les concentrations moyennes de tous les pesticides analysés pour cette station, j’obtiens une concentration totale de 1,99725µg/L. Dans le fichier des concentrations totales, la valeur est bien différente : 0,136µg/L.

Bref, j’ai sûrement manqué quelque chose ! Pourriez-vous m’éclairer sur la question ?

bonjour @neveldo

Les deux catégories (mesures effectuées par station et concentrations totales de pesticides par station) sont indépendantes. Il n’est pas possible de passer de l’un à l’autre, les modalités d’exploitation des données sont différentes. Ces deux catégories mettent à disposition des données différentes.

La somme de concentrations moyennes des différents pesticides est calculée en prenant en compte les concentrations mesurées (pour les analyses quantifiées) et les les limites de quantification divisées par 2 (pou les analyses non quantifiées), tandis que la moyenne annuelle de la concentration totale en pesticides prend en compte seulement les concentrations qui ont pu être mesurées (analyses quantifiées). (cf. règlement & métadonnées)

Bon courage !

Bonjour @strainel,

J’aimerais clarifier un point concernant le fichier « Descriptif fichiers ma_qp_fm_ttres_pesteso_XX ».
Les analyses non quantifiées concernent-elles les analyses pour lesquelles le pesticide recherché n’a pas été détecté par le laboratoire ? Dans ce cas, toutes les analyses donnant un résultat négatif sont considérées comme non quantifiées ?Ou cela concerne uniquement les analyses pour lesquelles le pesticide recherché a été détecté mais où il n’a pas pu être quantifié ? Et cela à cause des limites de quantification de l’appareil utilisé.

Merci @strainel pour l’explication ! J’avais effectivement mal interprété les infos dans les meta-données.

Merci pour le document complémentaire :slight_smile:

bonjour @lauledieu

Petit complément :wink:
Les analyses non quantifiées pour un pesticide sont celles pour lesquelles la concentration dudit pesticide n’a pas été chiffré par le laboratoire (concentration < seuil de quantification).

Cette absence de chiffrage ne signifie pas que le pesticide recherché n’est pas présent dans l’échantillon. Cela signifie que sa concentration est telle qu’elle ne peut pas être mesurée par les appareils de mesure du laboratoire.

N’hésitez pas à nous indiquer où vous avez décelé des résultats négatifs.
Car, sauf erreur, il n’y en a pas dans les données du concours.

bonjour @neveldo

Oui : c’est tout à fait normal.Les fichiers fournis dans le cadre du concours ne portent pas sur les DOM/TOM.