Prestations sociales : la Cnaf donne le mode d'emploi de son nouvel algorithme de ciblage des contrôles
À travers la publication du code source et d'explications détaillées sur sa démarche, ainsi que la mise en place d'un comité éthique et d'une charte, la Caisse nationale des allocations familiales (Cnaf) entend donner des gages de transparence et d'éthique sur son nouveau modèle de datamining permettant aux CAF de cibler une partie des contrôles réalisés auprès des bénéficiaires de prestations sociales.
© AR avec Adobe stock
Pour la Caisse nationale d'allocations familiales (Cnaf) et les caisses d'allocations familiales (CAF), l'année 2026 démarre avec la mise en service d'un nouvel algorithme d'appui aux contrôles, le DMDE 2026 (DataMining Données Entrantes 2026). Alors que le modèle précédent avait fait l'objet de vives critiques, des associations allant jusqu'à saisir le Conseil d'État pour demander la suppression de cet algorithme jugé discriminatoire envers les plus pauvres (voir notre article), la Cnaf prend cette fois les devants en revendiquant une démarche de transparence, avec la publication du code source de son nouvel algorithme, la présentation détaillée de sa démarche ainsi que des "garanties éthiques".
La Cnaf fait ainsi valoir la mise en place d'un comité éthique, qui comprend notamment des représentants d'associations d'usagers et des experts en droits, ainsi que la formalisation d'une charte "pour encadre le développement et l'usage des algorithmes et de l'IA".
Une analyse au cas par cas des variables sensibles
Quant au nouveau modèle de dataming, "dont la conception était rendue nécessaire par les évolutions réglementaires et la généralisation de la solidarité à la source depuis mars 2025", son élaboration a été "particulièrement guidée par la prise en compte des risques de discrimination liés aux variables retenues, en excluant les variables les plus sensibles ou contestables, selon une méthode explicable", indique la Cnaf.
L'algorithme d'aide à la décision permet d'établir une "cotation de risque" pour "cibler les contrôles sur les dossiers allocataires les plus à risque d’avoir des indus (trop-perçus de prestations sociales) élevés". Le DMDE 2026 se fonde pour cela sur les données des CAF, ainsi que sur les données du dispositif de ressources mensuelles (DRM) utilisées depuis 2021 pour le calcul des aides au logement et depuis le 1er mars 2025 (voir notre article) pour le pré-remplissage des déclarations trimestrielles de ressources du revenu de solidarité active (RSA) et de la prime d'activité dans le cadre de la réforme de la solidarité à la source. Il s'agit donc de "données fiables et maitrisées par la Cnaf, puisque ce sont les données utilisées pour calculer les prestations", est-il mis en avant.
Le nouveau modèle comporte deux versions : l'une s'appliquant à la période avant pré-remplissage des déclarations trimestrielles de ressources (17 variables) et le second "couvrant les prestations versées après la réforme" (11 variables). Pour concevoir ce nouvel algorithme, ont été passées en revue et "questionnées" les "variables pouvant conduire à des biais discriminatoires ou de données sensibles au sens du RGPD" (Règlement générale sur la protection des données) : situation familiale, sexe, handicap, lieu de résidence, "particulière vulnérabilité résultant de la situation économique", etc.
"Le principe retenu pour conserver une variable sensible est d’identifier s’il y a un lien entre la variable et la cible explicable par la règlementation", précise la Cnaf dans sa note explicative. Le genre et l'adresse ont été ainsi facilement écartés mais "certains critères liés à l’âge d’un membre du foyer allocataire ont été conservés, uniquement lorsque cela peut s’expliquer par la législation (par exemple, l’âge des enfants...)". Toutefois, "en raison de sa sensibilité particulière, la variable sur la nationalité du responsable de dossier et de son conjoint a été retirée d’emblée, même si la réglementation prévoit des conditions spécifiques pour les personnes de nationalité étrangère".
La Cnaf justifie par ailleurs le maintien des variables relatives à la situation économique : "cela parait inévitable puisqu’une large part des prestations versées sont conditionnées aux ressources". Si "le DMDE cible par nature davantage les foyers avec des revenus faibles que ceux plus aisés", il oriente moins vers les foyers sans aucune ressource "car ils ont moins de risque de se tromper dans leur déclaration de ressources que les foyers avec des faibles ressources, qui peuvent en outre varier fréquemment d’un mois à l’autre", est-il précisé. Les foyers sans aucune ressource, touchant donc des prestations plus élevées, ont de leur côté plus de chance d'être contrôlés dans le cadre des campagnes de contrôle aléatoire.
Une minorité de contrôles issus de l'algorithme en 2024
"166.000 contrôles réalisés en 2024 sont issus du DMDE, soit moins de 1% de l’ensemble des contrôles réalisés par les Caf", relativise par ailleurs la Cnaf. Les 31,5 millions de contrôles réalisés en 2024 par les CAF auprès de 6,4 millions d’allocataires, soit près de un allocataire sur deux, "ont permis de détecter au total 1,68 milliard d’euros d’indus (trop-perçus de prestations) et de rappels (moins-perçus, c’est-à-dire des régularisations en faveur de l’allocataire)". "92% de ces contrôles sont des régularisations automatiques issues d’échanges de données avec d’autres organismes, notamment France Travail", soit "le repérage d'incohérences", est-il précisé.
Les 8% restants sont des contrôles réalisés par des agents des Caf, principalement sur pièces (2,5 millions en 2024) et parfois sur place pour des contrôles approfondis (91.000 contrôles en 2024), sur la base d'incohérences, au sein d'un échantillon aléatoire ou à partir d'une cotation de risque. Les contrôles issus du DMDE ont représenté un peu moins de la moitié des contrôles sur place et moins de 5% des contrôles sur pièce, selon la Cnaf qui ajoute que "7% des contrôles DMDE donnent lieu à une qualification en fraude, à l’issue d’un protocole formalisé". Un poids qui pourrait bien se renforcer, à mesure que la "cartographie du risque d'erreur" s'affine et que l'usage du modèle se diffuse plus largement au sein des CAF.