Localtis
Lucas Boncourt pour Localtis

Les acteurs de l'Open data s'interrogent sur les limites et les risques des API

Infrastructures numériques, données

Développement économique

Transport mobilité durable

Smart city

Les  interfaces de programmation applicative (API) automatisent la diffusion de données ouvertes. L’Etat y recourt massivement pour ses grandes bases Open data. Les acteurs privés aussi, car elles facilitent la monétisation de la donnée. Leur multiplication interroge cependant les acteurs de l’Open data. Peut-on parler d’Open data s’il n’y a qu’une API ?  Car ce "robinet à données" peut aussi être fermé.

Dans la Manche, la maison des saisonniers  du conseil départemental propose sur son site internet des offres d’emplois saisonniers actualisées quotidiennement. Le site utilise l’API – pour application program interface – de Pôle emploi qui va chercher dans les 250.000 annonces de Pôle emploi toutes les offres locales, saisonnières, et uniquement celles-ci. "Géolocalisées, elles sont croisées sur une carte avec d’autres données (transport, hébergement…) éléments qui sont essentiels pour les travailleurs saisonniers", précise Nadège Lemoussu de la maison des saisonniers.  "Les API s’imposent pour les données volumineuses, comme les photos aériennes, ou celles changeant très vite",  explique Christian Quest d’Etalab. L’Etat est du reste le premier à utiliser cette technologie pour faciliter l’accès à ses bases de données Open data. Ces lignes de code sont répertoriées sur api.gouv.fr – qui liste aussi des API de collectivités - pour faciliter le travail des développeurs de services web et d’applications. Une grande variété de données sont ainsi proposées pour des usages très concrets : remplir automatiquement les données d’adresse d’un formulaire, récupérer toutes les aides sociales, consulter les points de permis….

Afficher les offres d’emploi locales

Pôle emploi propose pour sa part 32 API sur son site emploi-store-dev.fr. Ces API génèrent 1 à 2 millions de requêtes par mois, la plus populaire étant celle sur les offres d’emploi. "Ces API sont accessibles à tous et notamment aux collectivités. Nous leur proposons un accompagnement pour leur mise en place. Nous sommes également à leur écoute : Rouen nous a demandé d’intégrer le périmètre 'agglomération', ce sur quoi nous travaillons", détaille Marie-Joseph Kathleen, en charge de l’Open data à Pôle emploi. Si l’API offres d’emploi est la plus populaire, ce n’est pas la plus sophistiquée. "La Bonne Boîte permet par exemple aux candidats de postuler dans les entreprises qui statistiquement recrutent à une certaine époque de l’année. Grâce à cet algorithme, le CV peut être envoyé avant la publication de l’annonce !",  commente la chargée de mission. Le domaine dans lequel les API font florès est cependant celui de la mobilité : c’est du reste l’un des objectifs de la loi d’orientation sur les mobilités que de fluidifier la circulation des données transports, notamment en temps réel. Pour le moment le nombre de collectivités à proposer ce service est limité mais le dossier progresse, notamment sous l’impulsion de transport.data.gouv.fr (notre article). 

Un moyen de contrôler ou monétiser la donnée

Cette tendance à "l’APIfication" interpelle cependant les acteurs de l’Open data dont un des principes est de donner accès à des données brutes. "Est-ce une bonne pratique ? Ne cache-t-elle pas la volonté de contrôler in fine l’accès ? Ne réduit-elle par l’Open data à la création de services au détriment de l’information des citoyens qui ne maîtrisent pas l’informatique et les API ?", s’interrogeait récemment Jean-Marie Bourgogne, délégué d’Open data France sur le forum Teamopendata. Pour certains secteurs, elle est indispensable tant les volumes de données sont énormes - la Base Sirene de l’Insee qui répertorie l’ensemble des entreprises fait par exemple plusieurs giga-octets – mais les API présentent aussi des limites voire des risques. Le cas le plus emblématique est à cet égard Google Maps où, du jour au lendemain, les règles d’usage de l’API ont changé, les utilisateurs n’ayant pas d’autres choix que de s’adapter aux nouvelles règles, en renseignant un numéro de carte bancaire, ou de changer de service cartographique… (notre article). Si cette technologie est particulièrement prisée des acteurs privés – SNCF, Engie, Suez… - c’est qu’elle facilite la monétisation, actuelle ou future, du service. Une donnée Open data gratuite peut même être rendue payante via des API qui "valorisent" la donnée en la mixant avec d’autres. Et si l'API est très sollicitée, elle consomme des ressources (serveurs, réseaux…) qui justifient sa monétisation.

Une technologie avec des limites techniques

C’est du reste une des limites soulevées par Christian Quest : "Pour qu’elles fonctionnent correctement, il faut que l’utilisateur dispose d’un débit suffisant, mobile ou fixe. Par ailleurs, certaines API fonctionnant en cascade, un problème sur l’une se répercutera sur la totalité du service. Enfin une API n’est pas neutre : elle oriente l’usage de la donnée." Aussi la conclusion des échanges entre spécialistes de l’Open data est-elle unanime : il ne faut pas faire de l’API un mode exclusif en matière d’accès à la donnée. La bonne nouvelle est à cet égard que l’API fait partie des fonctionnalités proposées par les principales plateformes du marché (OpenDataSoft, Ozwillo, ArcGIS…) mais sans exclusivité : le téléchargement de données brutes est également proposé, sauf pour certaines données temps réel.

Mieux connaître les réutilisations et améliorer les données

Comme d’une manière générale sur l’ouverture des données publiques, les producteurs de données ne connaissent pas bien l’usage qui est fait des API : application, site, carte…. Ceux-ci obtiennent un nombre de requêtes sur leur serveur, mais rien de plus. D’où l’idée de certains d’associer aux API des clés d’identification uniques à chaque réutilisateur, cette clé servant aussi à maîtriser les réutilisations abusives. L’Etat réfléchit de son côté à fluidifier, voire automatiser les remontées des réutilisateurs pour améliorer la qualité de ses bases de données. C’est le concept « d’API retour » sur lequel travaille Etalab pour les bases de données les plus utilisées : adresses, entreprises…

Haut de page