L’open data à l’épreuve de la pénurie d’essence

Face à la pénurie de carburant sur plusieurs départements de France, un constat : la difficulté à trouver des informations fiables concernant les stations-service sur le territoire et leur disponibilité en carburant.

Comparatif

Les informations existantes ne suffisent pas

Les GPS proposent à leurs usagers des stations-service proches, et des cartographies de stations ont déjà été publiées. Or, ces informations se basent essentiellement sur des bases de données incomplètes.

Les 3 principaux référents en ligne sur l’état de la pénurie sont actuellement

Ces derniers répertorient 10 245 stations pour la France (chiffre fluctuant). Selon Le Monde, l’UFIP en dénombre 11 269, quand la base ouverte de référence en comptabilise 12 097 et il en manque encore. Pour ce qui est de l’état des stocks de carburant aux stations, le site prix-carburants.gouv.fr ne publie cette information qu’avec 7 jours de carence. Aucune initiative ne redistribue librement les contributions des conducteurs. Cette approche logiquement concurrentielle ne permet pas les enrichissements de l’information qui permettraient d’avoir une vision globale de la situation.

Les voitures ne circulent pas, l’information non plus.

L’association Libertic, qui fait la promotion du libre accès à l’information publique en open data a donc cherché à libérer les données aujourd’hui accessibles sur les stations-service. L’objectif étant de permettre à chacun de s’en emparer, de créer des cartes plus exhaustives et d’en favoriser la diffusion. Ces données permettront également de réaliser des sites collaboratifs qui remettraient librement à disposition les contributions sur la pénurie.

Voici les étapes, contrariétés, et découvertes de ce projet #Hackpenurie en cours.

 

Etape 1. Trouver des données

Nous avons d’abord listé les sources potentielles de données géolocalisant les stations afin de pouvoir les compiler. Jusque récemment, la publication d’une base de données d’entreprises sur un territoire était susceptible d’enfreindre le cadre du secret commercial, notamment au pretexte qu’une cartographie des acteurs permettrait de définir la stratégie de leur implantation (faites-vous plaisir). Or, depuis la loi Macron de 2015, un paradoxe se met en place : le secret des affaires (interprétation libre) en même temps que l’open data et la publication du registre Infogreffe, comportant le nom des entreprises et leurs adresses ont vocation à être librement disponibles. Voici quelques sources que nous avons répertoriées, n’hésitez pas à nous en indiquer d’autres !

Prix-carburants.gouv.fr

Cette base nationale collecte les informations et tarifs affichés aux stations-service. 12 097 stations sont répertoriées.

Problèmes

  • Erreurs dans la base : La base n’est pas propre. Des stations-apparaissent en Autriche, Somalie ou dans l’océan. Les longitudes et latitudes sont parfois inversées. Certaines donnéent semblent des doublons.

SomalieLa localisation de stations-service en France, selon la source officielle prix-carburants.gouv.fr qui commercialise la base par ailleurs…

  • Manque d’informations : Des informations ont été tronquées dans la version libre des données : il n’y a pas le nom de la station ni la marque, pénalisant le recoupement. Des incertitudes également sur le numéro identifiant des pompes.
  • Données à -7 jours : Le site ne publie librement que la base de la semaine passée. Or, si nous avions eu les prix du jour-même, nous aurions en même temps l’information sur les pompes n’ayant plus de carburant. L’accès à cette information coûte près de 40 000€. Tant pis pour la disponibilité aux pompes.
  • La base n’est pas exhaustive : Seules les stations avec un débit supérieur à 500m3 annuel sont répertoriées. Ce qui explique que les petites stations-services sont absentes de la base.

20160525_092036(1)Station orpheline. La station de Maisdon-sur-Sèvre n’est référencée nulle part (en même temps, elle est en pénurie de carburant…)

Infogreffe

Infogreffe dispose d’un site open data listant les entreprises immatriculées par année. Idéal pour améliorer la base source ? Fausse bonne idée.

Problèmes

  • Manque d’archives : Seules les entreprises immatriculées depuis 2013 sont répertoriées.

  • Catégorisation limitante : Impossible pour nous de retrouver les stations-services dans la catégorisation.

Nous avons abandonné cette source. En espérant que la publication du registre prévue en 2017 puisse prochainement combler ces lacunes.

Openstreetmap

OSM est une base de données cartographique contributive offrant des données totalement libres. Près de 10 000 stations-services ont déjà été répertoriées par les contributeurs. Grâce à Christian, les bénévoles en ligne et nos volontaires, nous nous sommes appuyés sur Openstreetmap.

tagfuel

Problèmes

  • Manque de données : Si la couverture au national reste impressionnante pour un travail de contribution, sur les 243 stations annoncées par la préfecture en Loire-Atlantique, 166 sont répertoriées.

  • Pas d’identifiants : Les données renseignées fournissent parfois le nom de la station, ou les numéros de téléphone mais pas d’identifiant unique permettant de recouper avec Prix-carburants. Il faudra se baser sur les coordonnées.

 

Stations GPL

Source découverte via Openstreetmap, le site http://stations.gpl.online.fr propose une base de données téléchargeable sur les stations distribuant du GPL. Ce sont des coordonnées GPS à convertir.

Problèmes

  • Qualité et Mise à jour : Le site ne semble plus à jour depuis 2011 et des erreurs sont constatées. Nous abandonnons cette source ; qui a tout de même servi à quelques recoupements.

BP Suisse

Nous avons commencé à chercher des données sur les sites officiels des distributeurs. Surprise, BP en Suisse propose une base de données « librement accessible ». Cette source est très riche et répertorie à elle seule près de 12 000 stations en France en comptant toutes ses marques. D’autres sites de distributeurs restent à explorer à ce jour.

Problème

  • Licence

La licence d’utilisation associée au service permettant de télécharger les données indique qu’elles sont « librement accessibles ». Est-ce qu’en suisse cela veut dire « réutilisable » ? Il sera toujours possible d’utiliser cette source pour recouper des informations.

Etape 2. Créer des données

Nous avons ensuite cherché quelques informations existantes qui pouvaient être converties en bases de données ouvertes. Ce qui donne :

  • Liste des carburants (source : prix-carburants.gouv.fr)
  • Liste des arrếtés préfectoraux liés à la pénurie (source : Ouest-France, préfectures)
  • Liste des distributeurs de carburant (source : Wikipedia)
  • Compilation des bases (source : prix-carburants/OSM/BP Suisse)
  • Création des correctifs des données africo-norvegiennes

Etape 3. Corriger, compiler et visualiser

La base de prix-carburants a été corrigée via BANO (base publiée ici) . Un exemple d’erreur ci-bas, avec le correctif en rouge intitulé « source gouv bano ».

visuel correctif

Et voici la carte listant et comparant différentes sources de données (OSM/BP/Prix-carburants/Correctif Bano).

Global comparatif

La carte de Nantes Métropole

Nous compilons ensuite les données collectées pour faire un test petite échelle, sur la métropole de Nantes.

Carte NM

Nous réalisons parallèlement le 23 mai une campagne de phoning pour vérifier la qualité des données et disponibilité des stations. Des adresses sont corrigées ou supprimées (base locale corrigée à publier prochainement).

Sur 27 stations (sic) affichées sur le listing pages jaunes indiquant les numéros de téléphone, 2/27 n’étaient pas des stations-services. 21 sur les 25 restantes (84%) ont répondu à nos appels. 18/21 sont en pénurie, 1/21 a encore du GPL, 2/21 ont encore deux carburants.

Réaliser ce travail de recoupement à l’échelle du département nous permettrait de vérifier si les chiffres de la préfecture prennent ou non en compte les quelques 3 000 stations-services indépendantes (source FF3C) qui ont probablement un faible débit et ne sont pas répertoriées sur prix-carburants.gouv.fr. A partir de là, est-ce qu’en comptant les stations au débit inférieur à 500m3 annuel le taux de pénurie serait plus élevé que celui annoncé ?

Etape 4 : Publication et enrichissement

Nous avons publié librement tous les jeux de données sur data.gouv.fr Chacun peut s’en emparer, les enrichir, et réaliser ses compilations sur son territoire ou au national. La correction du fichier prix-carburants.gouv.fr est également reversée.

Les axes d’améliorations identifiés

En d’autres termes : ce qui nous aurait facilité la tâche.

  • Publier les données quotidiennes exhaustives et corrigées de prix-carburants.gouv.fr
  • Que chaque distributeur publie la liste de ses stations
  • Avoir des identifiants uniques de stations accessibles dans les données
  • Avoir accès à l’enregistrement des stations-services sur Infogreffe avec un historique large
  • Envisager des campagnes cartographiques OSM sur ces données d’intérêt général pour améliorer la base ?
  • Bonus : Pouvoir réutiliser librement les logos des distributeurs pour l’interface usager des plateformes de contribution

Nous étrennons une nouvelle rubrique : Réponse au courrier de lecteurs

Cette semaine nous avons demandé des données ouvertes à la préfecture de Loire-Atlantique, qui n’a pas répondu à ce jour. Suite à cet appel en ligne, un journaliste nous a interpellé très aimablement précisant qu’il ne voyait pas l’intérêt de notre démarche – de recoupement d’informations et qualification des données – (ça laisse songeur).

Alors clairement à quoi sert cette initiative ?

  • À pointer que les efforts d’ouverture de données en France sont aujourd’hui trop faibles
  • À contribuer à l’amélioration de la qualité des données fournies
  • À fournir des données – aux medias notamment – pour qu’ils puissent travailler sur d’autres bases que des copiés-collés de communiqués de préfectures.
  • À favoriser les initiatives de réutilisation de ces données
  • À démontrer l’intérêt des données ouvertes comme levier de meilleure diffusion de l’information

 

 


Via un article de libertic, publié le 29 mai 2016

©© a-brest, article sous licence creative common info