Il y a les données et il y a le mode de représentation de ces données.
Le format CSV consistant à représenter les données sous forme de valeurs séparées par des points-virgules ou des tabulation n’est pas suffisamment complet pour fournir les méta-données nécessaires à la mutualisation des sources d’information.
De quelles données s’agit-il (un lieu, une personne, etc)? Quel est leur type (nombre, date, etc)? Le fichier est-il encodé en UTF-8 ou en ASCII?
Pour faciliter la consommation de ces jeux de données, des formats sémantiques seront plus indiqués. Et généralement de ce côté là, c’est XML qui est le plus complet et le plus répandu.
La difficulté cependant, est de s’accorder sur des « vocabulaires » adaptés à chaque domaine.