Quels sont les outils libres du secteur public pour la BI ?

Bonjour à toutes et tous,
Je souhaiterais savoir s’il existe aujourd’hui au sein des ministères des pratiques et outils libres de type BI (Business Intelligence) ?
Merci
Cordialement
Laurent Bonnet

La suite Pentaho est utilisée, notamment au Ministère de l’Agriculture.
Certaines administrations ont intégré les outils Talend.

Pour des besoins plus précis, la stack ELK est utilisée, en particulier pour l’analyse des logs. Ces solutions sont à ma connaissance déployées en production sur les projets du RIE et de FranceConnect.

L’équipe de data scientists de l’Administrateur Général des Données a également designé plusieurs tableaux de bord sur Kibana pour un Proof Of Concept, sans toutefois passer la solution en production.

Attention cependant, bien qu’Open Source les process de développement des logiciels cités ici ne sont pas totalement ouverts. Existe-t-il des solutions de type BI totalement libres?

Nous utilisons Pentaho (Community Edition) et en sommes fort satisfaits. Spagobi est plus conforme à l’idée que l’on se fait d’un logiciel libre (pas de double version Community/Entreprise) ; pour nous, Pentaho a l’avantage d’avoir une communauté très active et d’être techniquement très ouvert : c’est du javascript.

Nous venons de mettre en place une offre Pentaho (offre communautaire) accessible pour les ministères de l’Environnement et du Logement. Les premiers retours sont positifs, même si on est loin des possibilités de BusinessObjects. SpagoBI est actuellement utilisé par une direction métier, mais des questions se posent sur la pérennité de l’outil.
Nous disposons également d’une offre Talend, qui s’appuie sur la partie opensource pour les développements (studio) et sur la version payante pour le déploiement, la planification et le suivi en exploitation. C’est un choix opéré parce que nous avons un existant conséquent, mais techniquement il est tout à fait possible de se passer de ces composants propriétaires.

Bonjour, merci pour ta réponse. Sur quels périmètres et quels usages (rapport, dashboard, simulations, analytics…) utilises-tu Pentaho ?

Bonjoru JC, merci pour ta réponse. Concernant l’écart entre BO et Pentaho, quels gros écarts as-tu noté ? Pour quels usages et périmètres utilises-tu Pentaho ?
Sur les aspects RH, utilisez vous du Pentaho ou du BO ?
Merci
Cdt
Laurent

Bonjour,

Dans les services déconcentrés (régionaux et départementaux) du Ministère de l’Ecologie, pour ce qui est du spatial, s’était posée la question d’utiliser GeoKettle (greffon spatial développé au Canada, de Pentaho) ou le francophone Spatial Data Integrator (greffon du français Talend Open Studio,développé par CampToCamp, société française).

A titre personnel, je préfère Talend pour son ergonomie, ses nombreux connecteurs, et aussi car il s’agit d’un produit français, de fait très bien traduit

Malgré cela, le Ministère semble préférer GeoKettle pour un déploiement en SD du fait que beaucoup plus d’utilisateurs l’utilisant, ces derniers forment une communauté plus large et donc plus forte. Aussi, car il a fait ses preuves, dans certaines régions, pour des tâches courantes d’automatisation, de récupération de flux, et d’alimentation de bases de données

A noter que dans le SILL qui définit une ligne directrice pour l’adoption de tel ou tel logiciel libre au sein des administrations, Talend est marqué comme outil d’automatisation et de reprise des données (soit, prenant la fonction d’ETL), tandis que Pentaho est marqué comme Portail décisionnel. L’un servirait à transformer et digérer les données tandis que l’autre permettrait de les valoriser sous forme de tableau de bord.

Bonjour,

Au ministère de la culture on utilise - pour l’instant uniquement en mode prototype - des chaines ELK pour :

  • De l’analyse de trafic réseau à partir de flux netflow
  • De l’analyse de données métier depuis une base documentaire (par exemple savoir quels champs sont les plus valoriés avec quels valeurs)

Les retours sont très bons !
Concernant la volumétrie, on est à 25 milions d’événements / jour, en conservant 5 jours de données.

A noter que Kibana possède des restitutions de type cartes géographiques.

Elastic.co propose également une suite d’outils Beats permettant d’extraire et d’indexer différents types de sources : réseau (analyse des paquets de type base de données, HTTP, Redis, DNS, etc.), fichiers (logs applicatifs), utilisation ressources système (CPU, RAM, I/O, etc.) et des tableaux de bord correspondants sont disponibles.

Juste une remarque concernant GeoKettle : cet outil n’est plus maintenu par Spatialytics qui a développé sur un core Kettle 3.2 (la version actuelle de Kettle est la 6.0)

Des plugins cartographiques sont disponibles sur la marketplace dans Kettle 5 et 6, et permettent de retrouver les fonctionnalités disponibles dans GeoKettle, tout en bénéficiant des étapes standards de Kettle disponibles dans les versions >= 5

Ces plugins seront présentés lors de la rencontre de la communauté Pentaho France à Paris le 24 Mai 2016

Plus de détails ici : https://blog.atolcd.com/index.php/2015/06/26/une-extension-gis-dans-pentaho-data-integration-5/

Bonjour,

Nous utilisons la solution Pentaho Data Integration (PDI) dans la division de l’évaluation et de la prospective : service statistiques de l’académie d’Orléans-Tours à des fins d’extraction et préparation des données issus des différents SI de l’éducation nationale.

Nous l’utilisons notamment pour la sélection et la préparation de données utilisées :

  • dans les publications de la division (chiffre clés, données & indicateurs sur les élèves, les apprentis et les étudiants, sur les résultats aux examens de l’enseignement général, technologique et professionnel, sur les personnels …).
  • dans l’étude des formations, l’offre des langues enseignés, des enseignements d’exploitation dans l’académie ;
  • dans la construction de radars de performance des établissements du 2nd degré
  • en tant que fournisseur de données pour des applications conçues en académie.

Cordialement,