Défi n° 1 - Valoriser la jurisprudence des juridictions financières

La Cour des comptes ouvrira en open data le texte intégral de sa jurisprudence et celle des chambres régionales et territoriales des comptes. Le format retenu est le format XML (voire du HTML directement), ce qui permettra d’inclure des méta-données utiles aux réutilisateurs.

Le défi consistera à proposer des réutilisations valorisant ces données, par exemple des outils libres et opensource :

  • d’exploration de la jurisprudence ;
  • d’interfaçage avec Légifrance, si des normes juridiques sont citées ;
  • d’aide à la rédaction de décisions ;
  • etc.

Ce sujet est l’occasion d’échanger sur les projets qui pourraient être proposés par les participants à la #agenda:datasession-a-la-cour-des-comptes-27-28-mai-2016 !

2 J'aime

Les données correspondant à ce défi sont d’ores et déjà disponibles :

Voici une première librairie pour l’identification des textes et normes juridiques en open-source sur le forum d’openLaw :
http://communaute.openlaw.fr/t/librairie-php-pour-lextraction-decisions-normes-depuis-un-texte-brut/34

1 J'aime

Il y a des numéros Arpège présents dans le XML mais absents des docx :

Arrets Cour 2008.xml
[‹ 50716 ›]
Arrets Cour 2010 Sem2.xml
[‹ 59849 ›, ‹ 171-603 ›, ‹ 318826 ; 318978 ›, ‹ 337560 ›]
Arrets Cour 2015 Sem2.xml
[‹ S-2015-1777 ›, ‹ S-2015-1460 ›]
Arrets Cour 2012 Sem2.xml
[]
Arrets Cour 2015 Sem1.xml
[‹ 72504 ›]
Arrets Cour 2013.xml
[]
Arrets Cour 2007 Sem1.xml
[‹ 48423 ›]
Arrets Cour 2006.xml
[‹ 46535 ›, ‹ 46560 ›, ‹ 46710 ›, ‹ 46708 ›, ‹ 46849 ›, ‹ 46446 ›, ‹ 46279 ›, ‹ 46290 ›, ‹ 46293 ›, ‹ 45982 ›, ‹ 46136 ›, ‹ 46088 ›, ‹ 45956 ›, ‹ 46023 ›, ‹ 45933 ›, ‹ 46021 ›, ‹ 44944 ›, ‹ 44337 ›, ‹ 43931 ›]
Arrets Cour 2010 Sem1.xml
[]
Arrets Cour 2011 Sem1.xml
[‹ 60693 ›]
Arrets Cour 2011 Sem2.xml
[‹ 61654 ›]
Arrets Cour 2014 Sem2.xml
[]
Arrets Cour 2014 Sem1.xml
[]
Arrets Cour 2012 Sem1.xml
[]
Arrets Cour 2007 Sem2.xml
[‹ 48537 ›]

Il manque la balise de fin de Arrets Cour 2010 Sem1.xml @adn

Tu penses que le fichier est tronqué ?

Oui, dans les docx on a 142 fichiers pour 2010 alors que dans le XML il y a 34 (semestre 1) + 76 (semestre 2) = 110 références.

C’est corrigé (66 décisions au semestre 1) !
Merci beaucoup :wink: