Le data-journalisme, c’est de l’enquête, pas du code…

Steve Doig intervenait le 22 mars 2013 au SPQR (syndicat presse quotidienne régionale) pour expliquer l’intérêt concret du data-journalisme pour les éditeurs. Selon lui, c’est avant tout une manière d’apporter de la profondeur d’information, à moindre coût.

Steve Doig est un grand monsieur du journalisme. Il détient une chaire de journalisme assisté d’ordinateur de la fondation Knight à l’Université d’Arizona. Journaliste au Miami Herald pendant 19 ans, son enquête sur l’ouragan Andrew a été couronnée en 1993 du prix Pulitzer.

Le data-journalisme pour Steve Doig, c’est « les sciences sociales plus les échéances » (« social sciences plus deadlines »). Le fond du travail,  c’est de la sociologie, de l’urbanisme, des statistiques sociales… Mais comme il faut aller beaucoup plus vite que dans la recherche, on emploie les outils informatiques.

Les ravages de l'ouragan Andrew 1993 - ©Miami Herald
Les ravages de l’ouragan Andrew 1993 – ©Miami Herald

Lorsque en 1993, l’ouragan Andrew frappe la Floride, Steve fait une curieuse constatation. Certaines maisons n’avaient subi presque aucun dommage, tandis que d’autres étaient totalement détruites. Pour comprendre ce qui avait pu se produire, il commence par comparer les dégâts causés par la tornade avec ceux de 57 autres ouragans qui avaient frappé l’Etat. Il s’appuie ensuite sur les données publiques pour faire différentes comparaisons : impôts fonciers et taxes locales, nombre et dates des inspections urbaines, date de construction des bâtiments de la zone concernée…

Il découvre alors que les habitations les plus récentes avaient été les plus touchées. En creusant à partir de ce constat, il découvre que les matériaux de construction employés étaient de moindre qualité, que les inspections urbaines de sécurité avaient été bâclées et que les normes de construction avaient été assouplies. En analysant l’origine des donations faits aux partis politiques lors des dernières campagnes électorales, Steve Doig remarque aussi que l’argent venait des sociétés du bâtiment… Un scandale qui révèle des collusions graves entre le monde des affaires et la politique. Le pire, pour Steve, c’est que la Floride a eu de la chance : « les dégâts auraient été triples si Andrew s’était déplacé une trentaine de kilomètres plus au nord ».

Cet exemple est révélateur de ce que peut apporter le journalisme à la vie de la cité, car depuis, ces aberrations ont été corrigées en Floride. L’idée est d’apporter des preuves au delà des faits « put evidence beyond facts », pour aller au delà des apparences et comprendre le fond des choses.

Steve Doig évoquera d’autres scandales révélés grâce à l’examen des données, comme les taux d’intérêt gonflés pour les clients noirs et hispaniques de la banque Countrywide. Une analyse qui repose il est vrai sur la possibilité d’accéder aux statistiques ethniques aux Etats-Unis, ce qui reste compliqué en France, même si rien ne l’interdit plus officiellement.

Ou encore le scandale du « Whirlpool parc », bâti à quelques mètres d’une déchèterie contenant des produits toxiques qui ont causé cancers et autres maladies graves sur le long terme. Une affaire révélée par USA Today, suite à la comparaison statistique du nombre de cas cliniques dans une même zone géographique. On est proche du scénario d’Erin Brochovitch tiré d’une histoire vraie.

UN TRAVAIL BEAUCOUP PLUS ACCESSIBLE

La vulgarisation des outils, la baisse des prix des matériels, la simplicité des outils en ligne et la publication des données publiques rendent ce travail aujourd’hui accessible à tous les journalistes, potentiellement.

Plus besoin de grosses machines pour coder et décoder de gros volumes de données. Un PC grand public, un tableur Excel et un navigateur suffisent dans 90% des cas. Quant aux compétences requises, elles ne relèvent pas d’un niveau inaccessible.

Pour Steve, pas besoin d’être informaticien ou développeur. Les journalistes doivent-ils apprendre à coder ? Pas nécessairement, sauf s’ils souhaitent faire du data-scrapping, c’est à dire de l’extraction de données non disponibles. (ex : récupérer les statistiques des petites annonces publiées en ligne : quelles catégories de produits, quels prix moyens, quelles régions les plus actives etc.)

Il faudra en revanche comprendre le travail des développeurs pour mieux apprendre à collaborer ensemble : qu’est-il possible de trouver, combien de temps ça prend, quels formats sont exploitables…

Mais plus que tout, et c’est là que se situe la valeur ajoutée du journaliste : quelles informations sont pertinentes ? Le journaliste est un acteur clé du data-journalisme, car sa connaissance en sciences humaines, sa culture générale lui feront se poser les bonnes questions et croiser les bonnes informations.

Steve Doyle prend l’exemple des accidents de la route en France. Il récupère une plage de données sous forme de fichier Excel accessible sur data.gouv.fr. Par des fonctions de tri simple, il classe les départements qui comptent le plus de blessés et de morts. Il repère les écarts importants et voit immédiatement par exemple que les Bouches du Rhône sont beaucoup plus létales que l’île de France mais celle-ci compte plus d’accidents. Mais il lui manque une donnée clé pour comparer les différents départements : la densité de population.Une info qu’il va chercher ailleurs et croiser pour obtenir un indice de dangerosité. Ici un simple calcul nombre morts divisé par nombre population multiplié par 10 000 (un gros chiffre pour le rendre lisible).

carte de Londres ©Flickr.com
carte de Londres ©Flickr.com

Ainsi, il se rend compte que certains départements, en dépit d’une population moindre sont plus mortelles que d’autres. Là commence le travail d’investigation journalistique. Comme le disait Nicolas Kayser-Bril lors d’une autre conférence au Figaro, le data-journalisme n’est souvent qu’un point de départ. Qu’est-ce qui distingue les département aux chiffres de mortalité les plus élevés des autres ? Où ont lieu précisément la plupart des décès ? Y a t-il des endroits très accidentogènes, une vétusté des routes, un problème de signalisation ? Ou s’agit-il simplement du découpage urbain qui mélange zones d’habitation et routes départementales où les limitations de vitesse plus élevées sont naturellement plus létales qu’en centre-ville ?

On entre ici sur le terrain de l’enquête de sciences sociales et chacune des hypothèses devra être analysée, confirmée ou infirmée par les faits, comme toute enquête journalistique « traditionnelle ».

COMMENT METTRE SON JOURNAL AU DATA-JOURNALISME ?

Le plus important, c’est la motivation des rédacteurs. Ils doivent comprendre l’intérêt de ce travail, apprécier de le faire, même s’il faut se faire un peu violence au début. La mauvaise nouvelle, c’est qu’il y a des chiffres. La bonne c’est que ce n’est pas sorcier, rassure Steve Doig.

Le professeur met aussi en garde les éditeurs : il faut accepter que toute recherche ne donne pas lieu à un papier. Il y a des pistes qui ne donnent rien, il faut en prendre son parti et persévérer. Attention à la tendance productiviste, source d’erreurs et de pression… On l’a hélas déjà vu avec l’irruption d’outils comme Google analytics le risque de course à l’audience et de déformation éditoriale (titres racoleurs ou survendus…).

Du côté des journalistes, il faut rester très prudent dans l’analyse des chiffres et si possible vérifier ses calculs à plusieurs pour éviter la grosse boulette, le faux scoop liée à une virgule placée au mauvais endroit. Ou une erreur de méthodologie (comparer les chiffres de deux années différentes, oublier un paramètre essentiel comme le climat spécial ou tout évènement d’importance).

Par ailleurs, le data-journalisme, ce n’est pas que des enquêtes sérieuses et longues. On peut aussi traiter de choses simples et ludiques. Steve donne l’exemple de l’analyse du fichier des « dog licences  » (l’immatriculation et vaccination des chiens, obligatoires aux Etats-Unis). La comparaison des noms et des races de chiens révèle des décalages savoureux : des noms puissants (Hercule, Satan) pour des petits chiens et le contraire, comme si les propriétaires souhaitaient compenser un excès de vulnérabilité ou d’agressivité supposée de leur toutou.

L’analyse des petites annonces permet de repérer les produits les plus populaires, d’établir des tendances à la hausse ou à la baisse, d’établir le top des cadeaux ratés d’après les fêtes qui se retrouvent sur le bon coin… Autant de sujets légers et amusants, faciles à produire et qui sont assurés d’un succès d’audience.

QUELLE ORGANISATION IDEALE ?

Steve Doig compte trois métiers essentiels :

1- Des journalistes d’investigation

2- Des analystes de données

3- Des développeurs et designer

Pour lui, l’équipe data idéale pour un journal de taille moyenne, c’est deux journalistes d’enquête, dont un très polyvalent, capable d’enquêter, mais aussi de traiter analyser les données. Plus un développeur et deux designers pour mettre en forme les résultats et maximiser leur impact. Etre capable d’allier la profondeur d’information à la simplicité et l’agrément de lecture relève d’un vrai savoir-faire de « magiciens » estime-t-il. Une phrase qui fera plaisir à mon équipe d’ Askmedia, qui s’efforce de réussir cette gageure tous les jours ;-).

Une équipe qui reste quand même réservée aujourd’hui aux grands journaux ou aux agences comme la mienne, mais qui n’empêche pas de petits « bidouillages » avec des outils plus simples et accessibles à tous. Comme Info.gram, Google Fusion ou Datawrapper

©Instagr.am la dataviz facile
©Instagr.am la dataviz facile

Mais ce travail qu’il soit internalisé ou externalisé, reste soumis à l’accès aux données qui reste cruciale. En France la loi de 1978 sur le libre accès aux documents publics est souvent contournée par les administrations qui traînent la patte pour livrer les informations. On est loin de la transparence américaine du Freedom of information act qui permet d’accéder plus facilement aux données.

Pas d’utopie toutefois : les informations sensibles restent soigneusement opaques ou noyées dans la masse. C’est toujours au journaliste d’aller les chercher, parfois aux forceps, et d’exhumer ce qu’on veut lui cacher. Pas de changement sur le fond, le jeu du chat et de la souris continue, mais avec de nouveaux outils et de nouvelles possibilités enthousiasmants.

Cyrille Frank

Sur Twitter
Sur Facebook
Sur Linkedin

A LIRE AUSSI :

14 commentaires sur « Le data-journalisme, c’est de l’enquête, pas du code… »

  1. Dispose-t-on de données data-journalistiques sur ce journalisme-là, celui auquel il faut mettre un grand “J“. A l’époque du zapping, des tweets et de la téléréalité comment évolue-t-il? Le produit-on toujours autant? Le lit-on plus ou moins qu’avant? Répondre à ces questions serait très instructif sur le devenir de nos sociétés.

    1. Bonjour GV,

      Il n’y a pas encore d’étude à ma connaissance sur l’ampleur du mouvement en France, juste une connaissance empirique. Certains groupes comme Le Monde ont recruté des experts comme Steve pour faire ce job, d’autres s’y intéressent, sans trop savoir comment procéder (Le Figaro) et j’ai pu former certains groupes aux outils les plus accessibles de data-visualisation à partir de données retravaillées sous Excel.

      C’est encore très timide, mais je suis sûr que ce mouvement s’inscrit dans un retour nécessaire au slow-news, à la profondeur et à la mise en contexte.

      Il y toutefois un écueil à éviter : c’est la gadgetisation du concept. Il faut que ces formats servent l’utilisateur et non pas l’image « moderne » auprès des annonceurs.
      Parfois un bon veil enchaînement de mots est plus efficace qu’un schéma, aussi interactif soit-il… 🙂

      Nous ne sommes qu’au tout début de ce mouvement en France, à suivre…

      A bientôt !

      Cyrille

  2. Dispose-t-on de données data-journalistiques sur ce journalisme-là, celui auquel il faut mettre un grand “J“. A l’époque du zapping, des tweets et de la téléréalité comment évolue-t-il? Le produit-on toujours autant? Le lit-on plus ou moins qu’avant? Répondre à ces questions serait très instructif sur le devenir de nos sociétés.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *