Localtis

Des data scientists pour mieux exploiter les données de l’Etat

Publié le
par
Lucas Boncourt pour Localtis
dans

Infrastructures numériques, données

Smart city

La promotion 2019 des  "entrepreneurs d’intérêt général" met l’accent sur l’intelligence artificielle et l’open data. Données télécoms,  anonymisation en masse des décisions de justice… plusieurs projets sont susceptibles d’intéresser les collectivités.

Depuis trois ans, la direction interministérielle du numérique et du système d'information et de communication de l'État (DINSIC) héberge des "startups d’Etat" où de jeunes ingénieurs et designers sont missionnés par des administrations centrales pour résoudre des problèmes opérationnels en recourant à des méthodes "agiles", caractérisées par des équipes restreintes, un temps court et une grande liberté d’action. La promotion 2019, présentée le 15 janvier 2019 par le secrétaire d’Etat au numérique Mounir Mahjoubi, ambitionne de s’attaquer à 15 challenges posés par des administrations centrales de l’Etat . Les projets présentés font la part belle à l’intelligence artificielle, aux spécialistes des bases de données, du "machine learning" et autres techniques d’exploitation et de valorisation des "big data". Des technologies utilisées pour "rendre le droit du travail plus lisible", "détecter les faux avis sur internet", "cartographier les parcelles bio", "aider les réfugiés à réaliser leurs démarches administratives" ou encore "mieux cibler les contrôles des navires dans le cadre de la surveillance du trafic maritime". Parmi les 15 projets, trois intéressent plus particulièrement les collectivités territoriales.

Une vision plus claire de l’aménagement numérique

Le challenge "datareg", lancé par l’Arcep, vise à "mettre la circulation de la donnée au cœur de ses missions", en fournissant aux citoyens comme aux collectivités une "vision claire des réseaux et services disponibles". Il est vrai que ces dernières années l’Arcep a multiplié les bases de données (opérateurs, collectivités, crowdsourcing…) comme les sites internet (monreseaumobile.fr, cartefibre.arcep.fr, jalertelarcep.fr…) rendant complexe la compréhension des enjeux d’aménagement numérique. L’ambition de Datareg est donc de "développer les outils qui permettront une centralisation, une circulation, une publication et des croisements simplifiés des données de l’Arcep pour gagner en performance et massifier les données mises à disposition du grand public et des réutilisateurs de données". 

L’anonymisation en masse des décisions de justice

Le projet "openjustice" va travailler pour sa part sur l’anonymisation en masse des décisions de justice. Le challenge, proposé par la cour de cassation (mais qui est aussi une exigence forte des sénateurs), part du constat qu’aujourd’hui le nombre de décisions de justice en libre accès (open data) est très limité – 15 000 sur Jurifrance et 10 fois plus sur Jurica – très loin du flux annuel qui atteint 3,9 millions de décisions. Le challenge vise donc à "pseudonymiser" en masse les décisions de justice et à limiter les possibilités de réidentification des justiciables grâce à l’intelligence artificielle. Comme le souligne la présentation du challenge, les résultats de ces travaux pourront largement bénéficier à d’autres types de données devant être pseudonymisées avant leur diffusion. On pense notamment aux délibérations et arrêtés des collectivités territoriales contenant des données nominatives.

Limiter la fraude à l’immatriculation

Le projet IA Flash, proposé par l'Agence nationale du traitement automatisé des infractions (Antai) et la Mission de gouvernance ministérielle des SIC du Ministère de l'Intérieur,  a pour objectif d’éviter l’envoi de contraventions à des propriétaires dont l’immatriculation a été usurpée. Selon l’Antai, chaque année 10 000 personnes reçoivent à tort un avis de contraventions en raison de l'utilisation de leur numéro d'immatriculation par un autre véhicule. Cette usurpation résulte, soit d'une erreur lors de la confection de la plaque d'immatriculation, soit d'une usurpation intentionnelle.  L'objectif du projet est recourir à l'intelligence artificielle pour vérifier que le modèle de véhicule flashé correspond bien à celui figurant sur la carte grise. Ce projet, s'il réussit, permettra donc de fiabiliser l’envoi des contraventions relevées par contrôle automatisé. 

Les jeunes candidats ont désormais 10 mois – durant lesquels ils sont embauchés en CDD par l’administration– pour élaborer une feuille de route, avec toute liberté sur le choix de la méthode et des technologies. Rendez-vous est donc pris pour la restitution en novembre 2019.

Haut de page