Archives

Open data : des usages bien réels mais en manque de visibilité

Moteur de l'ouverture des données, les réutilisations de données publiques seraient plus massives qu'on le pense. C'est en tous cas l'avis d'Open Data France qui vient de publier une compilation de réutilisations de données.

Dans un certain nombre de collectivités, l'ouverture des données tient pour beaucoup de la poule et de l'œuf. Pour développer les usages, il faut des données abondantes et de qualité mais pour convaincre les élus de s'y lancer pleinement, il faut pouvoir leur montrer que l'open data sert à quelque chose, au-delà du respect d'obligations réglementaires. Or, sur ce volet 'réutilisation', les 450 portails locaux recensés par Open Data France comme le portail data.gouv.fr n'apportent pas de réponses satisfaisantes. Les réutilisations (déclaratives) sont trop souvent anecdotiques et bien loin de la promesse de valeur annoncée lors des débuts de l'open data dans les années 2000. En apparence. Car selon un ouvrage publié jeudi 20 juin par l'association Open Data France, on serait en face d'un "iceberg des réutilisations" avec une partie émergée mais aussi de nombreux cas de réutilisations invisibles. 10 thématiques sont explorées dans ce document (agenda, foncier, déchets, stationnement, mobilité, emploi, flux…) agrémenté d'interviews d'entreprises et de collectivités.

Une intermédiation qui opacifie les usages

"Dans les réutilisations massives, le meilleur exemple est celui de Google, grand consommateur d'open data. Mais combien d'utilisateurs de Google Maps savent que les tracés et horaires des transports publics qui s'affichent sur leur écran sont issus de l'open data ?", a illustré Jean-Marie Bourgogne, délégué d'Open Data France lors d'un forum sur la data territoriale, organisé par La Gazette le 20 juin à Paris. Et au-delà de Google et autres City Mapper – qui génèrent des millions de requêtes chaque jour dans les bases de données ouvertes des transporteurs – ce sont des dizaines de calculateurs locaux qui utilisent des données ouvertes. Certains sont portés par des autorités organisatrices de mobilité, d'autres par des startups comme Pysae, Mybus ou encore Karos. Avec parfois une simple fonction d'enrichissement d'un service, à l'image de BimBamJob qui propose aux postulants à des emplois à domicile de calculer automatiquement le temps de parcours pour s'y rendre en transports en commun. Un site qui, comme de nombreux autres, utilise une API, un connecteur qui récupère automatiquement les données… sans vraiment savoir d'où les données viennent. Le manque de visibilité des réutilisations de données tiendrait ainsi pour beaucoup à "l'APIfication" de l'open data. S'y ajouterait un phénomène d'intermédiation des données ouvertes par des acteurs proposant des données – ouvertes et non ouvertes – sur des thématiques sectorielles. Le cas du tourisme est à cet égard exemplaire : les données sont saisies par les offices de tourisme dans des systèmes d'information touristiques gérés par des plateformes comme Apidae ou Touringsoft. Ces acteurs les traitent, les enrichissent puis les rediffusent (partiellement) en open data via des API. Elles sont néanmoins très appréciées des startups (l'exemple de Myvisito est cité) qui trouvent là des gisements de données exhaustives, homogènes et à jour.

Conventions et mails en moins

Certaines réutilisations seraient ensuite si banales qu'elles sont peu évoquées, comme dans le domaine de l'urbanisme, où l'open data n'est pas une révolution mais un changement de mode d'accès à la donnée, à commencer par l'interne. "Avant nous répondions aux demandes par mail ou signions des tas de conventions avec les notaires ou les agences immobilières, désormais les utilisateurs passent directement par la plateforme open data. On ne connaît pas exactement les usages mais ce qu'il y a de certain c'est que si le serveur est en rade ou qu'une donnée n'est pas mise à jour je suis tout de suite informée !", explique Séverine Ferrant, responsable open data du Grand Poitiers. Et si l'open data de l'urbanisme a été tiré par la directive Inspire, il connaît un regain avec la libération des données cadastrales et (tout récemment) des valeurs foncières. Des données exploitées par une myriade de startups qui, à l'image de permetezmoideconstruire, centralisent toute l'information disponible sur une parcelle. Les données d'agenda font également partie de celles qui suscitent un grand intérêt auprès de la presse locale mais aussi des collectivités qui évitent les saisies multiples et peuvent innover dans la manière de les diffuser. Après le lancement d'un site événementiel "sortir", le Sicoval, près de Toulouse, a par exemple développé le chatbot Coco pour valoriser son open data (événement, qualité de l'air, marchés…). Enfin, certaines réutilisations sont délibérément "cachées". Le cas du géomarketing serait ainsi exemplaire : ces cabinets utilisent toute sorte de données pour aider leur client à choisir la meilleure implantation immobilière ou commerciale : trafic routier, fréquentation touristique, connexions wifi, données sur les commerces concurrents… Des réutilisations jamais affichées sur leurs sites internet mais qui sont pourtant réelles et créatrices de valeur.
Les domaines dans lesquels les réutilisations sont les plus importants partagent plusieurs caractéristiques : l'existence de standards (GTFS dans les transports, Inspire pour la géodata…), des portails nationaux centralisant les données, des usages centrés sur les préoccupations quotidiennes des usagers et une communauté d'acteurs organisée. Des domaines qui ont valeur d'exemple pour l'association qui émet 10 recommandations pour massifier les réutilisations. 

Les 10 pistes d'actions d'Open Data France


1. Embrasser l’ensemble des données territoriales en tirant partie de l’avancée de l’open data
2. Travailler sur la normalisation et la standardisation des données
3. Mettre les usagers au centre des démarches open data 
4. Promouvoir un open data utile aux petits territoires 
5. Faciliter la production des données (saisie, éditeurs de logiciels, extracteurs nationaux)
6. Définir des bonnes pratiques sur les API
7. Veiller à l’émergence de plateformes d’intermédiation pleinement ouvertes 
8. Renforcer les collaborations avec les réutilisateurs 
9. Faire mûrir les régimes de licences pour faciliter les adoptions et leur respect
10. Continuer à valoriser les réutilisations