Quelles sources de données pour bien alimenter le débat social ?

Par Didier Blanchet intervient sur les conférences : Vers un grand conflit intergénérationnel et Les statistiques au défi de la crise

Traduire en chiffres aussi objectifs que possible l’évolution de l’économie et de la société est la tâche quotidienne des agents de l’Insee et de l’ensemble de la statistique publique. C’est une activité très exposée qui l’a été encore plus qu’à l’habitude au plus fort de la crise.

La soudaineté de cette crise a créé une attente de chiffrages rapides : à quelle vitesse se répandait la pandémie ? quels étaient ou allaient être les effets sur les différents secteurs de l’économie des mesures de confinement mises en place à partir de la mi-mars ? Il a fallu répondre à ces attentes alors même que les conditions habituelles de production de nombreux chiffres étaient fortement perturbées, avec notamment l’obligation d’interrompre la plupart des enquêtes de terrain.

Le système statistique a répondu à ce défi, en actionnant tous les leviers qu’il avait à sa disposition. Le traitement de certaines sources cruciales a pu être accéléré, notamment l’état civil pour le suivi des décès. Des enquêtes ad hoc par internet ont été mises en place pour suppléer celles dont la collecte était devenue impossible ou dont les questionnements étaient devenus temporairement inadaptés. La période a aussi été l’occasion d’intensifier le recours à de nouvelles sources dont l’utilisation était en train de monter en puissance ou pour l’exploitation desquelles l’Insee avait commencé à poser des jalons, telles que les données de caisse des enseignes de la grande distribution ou les données de transaction par cartes bancaires. Plus largement, elle a conduit à explorer tous azimuts tout ce qui pouvait éclairer de près comme de loin ce qui se déroulait sous nos yeux : données de fret ferroviaire, de consommation d’électricité, données de téléphonie mobile, données issues des recherches des internautes sur le Web, données satellitaires…

Élargir la gamme des instruments

Cela augure-t-il d’une nouvelle ère dans laquelle les sources traditionnelles auront été mises au placard et auront été définitivement remplacées par des sources de données réputées plus modernes, plus complètes, plus rapides ? Pour reprendre le titre de l’une des sessions de ces JECO, « Google en sait-il plus que l’Insee ? », si oui, pourrait-on désormais se contenter de ce savoir-là ? Il est normal que se pose la question. Y répondre doit tenir compte de ce dont a besoin le débat public. Il lui faut un noyau dur de données établies selon des protocoles stables et transparents, débouchant sur des indicateurs quantitatifs dont on sait exactement ce qu’ils mesurent. Répertoires, recensements, enquêtes et sources administratives sont à ce stade les quatre piliers sur la base desquels se construit cette information. Notamment, les sources fiscales et sociales sont les mieux à même d’éclairer la question cruciale des revenus et des inégalités. Ce sont elles qui, en l’état, pourront nous dire de manière exhaustive comment la crise aura atteint les différentes catégories d’agents économiques.

Plusieurs des nouvelles sources de l’ère de la data vont sûrement venir élargir encore cette gamme d’instruments dont dispose actuellement le statisticien. Il va falloir s’employer à en tirer le meilleur.

Mais un type de données n’a pas à chasser les autres. Le statisticien ne doit négliger aucune des sources auxquelles il peut avoir accès, pour mobiliser en connaissance de cause celles qui peuvent répondre de manière fidèle et précise aux questions qu’on lui pose.

origine du blog
Auteurs du billet