[Data] Dans les coulisses des pages Wikipédia des candidats

Article initialement publié sur le site de la 92è promotion de l’ESJ Lille « Au Charbon ».

Wikipédia est une source d’information pour des millions de citoyens, qui devient cruciale en période électoriale. Comment fonctionnent les pages de candidats, et qui y contribue ? Nous avons analysé les pages Wikipédia des cinq principaux candidats à la présidentielle, permettant ainsi de rejouer la campagne telle qu’elle s’est jouée sur le net.

 

Tapez « Emmanuel Macron » sur Google, et le premier résultat que vous obtiendrez sera sûrement sa page Wikipédia. Idem pour tous les autres candidats, dont les pages Wikipédia, très proposées par Google, ont été consultées plus de 11,3 millions de fois entre septembre 2016 et avril 2016 pour les cinq plus importants d’entre eux. Un enjeu démocratique crucial en période électorale. Nous avons analysé le comportement des pages des cinq principaux candidats, entre le 15 septembre 2016 – juste avant le début de la primaire de la droite – et le 15 avril 2017 – moins de deux semaines avant le premier tour de la présidentielle. Retour sur les batailles d’éditions qui s’y sont déroulées pendant la campagne.

Les pages s’allongent au fil de la campagne

La période électorale est tout d’abord le moment où les pages des candidats s’allongent. Au rythme de l’actualité, les contributeurs plus ou moins confirmés viennent garnir les « wiki » des candidats, avec toujours la même exigence, qui fait la puissance de Wikipédia : la vérifiabilité. C’est-à-dire que toute information ajoutée doit être sourcée, et renvoyer à un article de médias, un livre, une déclaration publique, etc.
La page la plus fournie est celle de Marine Le Pen. Au début de la campagne électorale, les pages de François Fillon et Jean-Luc Mélenchon venaient ensuite. Mais au fil des mois, c’est la page d’Emmanuel Macron qui a le plus gagné en informations, le plaçant à la troisième place en avril 2017.

evolutiontaille

En tout, les pages des cinq principaux candidats ont été éditées 3975 fois sur la période étudiée. Des modifications librement consultables, conformément à la politique de transparence de Wikipédia. Cela fait une moyenne de 19 modifications par jour. Mais les pages n’attirent pas toutes le même niveau d’intérêt des internautes.

L’inégale activité entre les pages des candidats

Avec 1 300 modifications, la page de François Fillon a été la plus éditée, notamment du fait de la primaire de la droite et des affaires. Mais si l’on s’intéresse au nombre de contributeurs, c’est Emmanuel Macron qui arrive en tête, avec 270 internautes ayant apporté des modifications sur sa page.

comparez

Un décompte qui a toutefois des faiblesses, car il ne permet pas de distinguer entre réels apports informationnels et ajouts inutiles ou plaisanteries de mauvais goût (appelées « vandalisme » par la communauté des Wikipédiens). En effet, le fonctionnement de Wikipédia permet à tout un chacun d’écrire ce qu’il veut, même si les mauvaises blagues sont très rapidement repérées et nettoyées.

En temps de campagne électorale, les « guerres d’édition » entre militants se font aussi ressentir sur Wikipédia. De fait, comment exprimer clairement, et d’une manière qui satisfait la communauté, le rapport de tel ou tel candidat avec la Russie, ou sa position concernant les enjeux sociétaux ? Des débats peuvent ainsi parfois enfler, comme en janvier dernier, quand la rubrique « religion » de la page de François Fillon a été l’objet d’un vrai débat entre contributeurs (100 modifications en cinq jours).

On pourrait s’attendre à ce que certains candidats attirent davantage les « trolls » que d’autres. À priori, il n’en est rien. Lorsqu’on observe le nombre de suppressions (c’est-à-dire le nombre de fois où les Wikipédiens ont jugé qu’un élément était inutile ou inapproprié), les candidats sont presque à égalité. La part des suppressions dans l’ensemble des modifications oscille entre 27 % chez Marine Le Pen et 36 % chez Jean-Luc Mélenchon.

A ce stade, on peut constater un double paradoxe concernant la page Wikipédia de Marine Le Pen. Sa page reste la plus fournie tout au long de la campagne, mais c’est celle qui est la moins modifiée (379 modifications en sept mois). Et surtout, elle a été la moins consultée, avec 1,1 million de vues, alors que Marine Le Pen s’est hissée au second tour avec 21,3 % des voix.

Qui fait Wikipédia ?

Qui sont ceux qui éditent ces pages politiques? Wikipédia prétend être une encyclopédie participative, gratuite, faite par tous et pour tous. Mais l’analyse des pages des candidats, montre qu’on est loin de cette vision inclusive de l’édition.

Les cinq pages ont été modifiées par 764 internautes. Mais tous ne participent pas à la même échelle. D’un côté, il y a les tout petits. 591 contributeurs (77% du total) n’ont participé qu’une ou deux fois. Parfois pour faire du “vandalisme”, parfois pour de réelles contributions. De l’autre côté, se trouvent les plus gros. Les 50 contributeurs les plus actifs (sur 764) ont réalisé 63% de toutes les modifications. Une minorité d’individus est responsable d’une majorité de l’activité sur ces pages Wikipédia.

contributeurs

Parmi les principaux contributeurs, un certain Erik Bovin, responsable à lui seul de 14% des modifications. Il est actif sur toutes les pages que nous observons, avec tout de même plus de contributions sur la page d’Emmanuel Macron. « Erik Bovin » est en réalité un internaute de 26 ans, diplômé de Sciences Po Lyon, qui travaille aujourd’hui dans un cabinet d’audit. La politique est son sujet de prédilection, une passion qu’il alimente en suivant de près l’actualité.

Le jeune homme est conscient du déséquilibre entre l’activité des uns et des autres sur ces pages. « Je le regrette, affirme-t-il. C’est pour cela que j’essaye d’encourager tous les internautes, en utilisant une fonction spéciale de “remerciement” quand leur ajout est utile.»

En période électorale, « Erik Bovin » confirme la recrudescence des interventions militantes, qu’il a pu observer sur les pages des politiques. « Mais on parvient à les modérer assez facilement. Les attaques de trolls militants sont occasionnelles et vite réglées », explique-t-il. En effet, comme de nombreux autres « Wikipédiens », Erik utilise une fonction qui permet de recevoir une alerte dès qu’une page choisie est modifiée. La liste de pages suivie par Erik Bovin est plutôt fournie afin d’assurer une régulation efficace. Si bien que les mauvaises informations (comme « Jean-Luc Mélenchon meurt le 18 janvier 2017 ») ne restent que quelques minutes en ligne.

Le travail de ces centaines de contributeurs anonymes est un projet politique qui n’est pas anodin. Erik Bovin raconte qu’il a commencé à contribuer à l’encyclopédie numérique en 2010. Le jeune homme raconte qu’il était, à l’époque, « complaisant » avec la complosphère, Dieudonné, Alain Soral, ayant lui même un proche impliqué dans ces cercles. Wikipédia a été un outil d’auto-éducation et l’a éloigné de ces sphères. Comme si l’exigence de vérifiabilité, couplé au contrôle de la communauté, étaient en complète opposition avec ces sphères. Bref, l’utopie politique (de gauche ?) de Wikipédia a des effets parfois insoupçonnés.

Brice Le Borgne

Vidéo d’introduction réalisée en partenariat avec l’école de graphisme lilloise E-Art Sup, sur la base d’une analyse data personnelle.

Publicités

[Article] Quelle couleur pour Macron et Le Pen ? Le casse-tête des rédactions

Article initialement publié sur le site de la 92è promotion de l’ESJ Lille « Au Charbon »

Les couleurs ont un sens, surtout quand il s’agit de politique. Pour les partis installés dans le paysage politique depuis des décennies, la question se règle rapidement : rouge et rose à gauche, bleu à droite. Mais de quelle couleur représenter les résultats d’Emmanuel Macron et de Marine Le Pen ?

C’est un casse-tête éditorial, technique et esthétique, auquel les équipes des grands médias ont commencé à se confronter il y a plusieurs mois. Quelle couleur utiliser pour représenter Emmanuel Macron et Marine Le Pen, quand l’un ne se revendique « ni de gauche, ni de droite », et l’autre tente de se défaire de son image d’extrême droite ? Au Parisien, la question épineuse de la couleur de Macron a surgi dès février dernier, comme en témoigne Pierre Chausse, un des responsables numérique du quotidien :

A France Télévisions, la question s’est posée dès novembre 2016. Arnaud Vincenti, directeur artistique de l’information du groupe, a participé au choix des couleurs, ensuite adoptées par l’ensemble des chaînes locales et nationales, sites d’information et applications de France TV et France Info. « L’ensemble des couleurs était déjà trusté par les partis déjà existants, donc l’arrivée de nouveaux partis change la donne », admet-t-il. Les rédactions ont donc dû jongler avec leurs propres contraintes. Voici le résultat de cette délibération, concernant Marine Le Pen, pour plusieurs grands médias français, depuis 2012.

Comment les médias représentent le Front national depuis 2012 ?

Le Monde

Média Présidentielle 2017 Législatives 2012 Présidentielle 2012
Le Figaro
Libération
Le Parisien
France Info
AFP

Alors que les choix de couleurs étaient hétérogènes en 2012, une bonne partie des médias opte cette année pour différents tons de bleu marine. « Ça n’a pas trop fait débat chez nous, on a opté pour un bleu-vert », se souvient Arnaud Vincenti.

Un choix éditorial ?

Au sein des équipes du Monde, le choix a été moins évident. « On hésite sur la couleur du Front national depuis 2012, explique Jérémie Baruch, de l’équipe des Décodeurs. Quand Marine Le Pen a lancé le Rassemblement Bleu marine, on a opté pour la couleur bleu marine ». Un choix qui ne leur convenait qu’à moitié, car cela revenait à reprendre les éléments de  communication visuelle du parti. « On ne voulait pas éditorialiser dans son sens, on est donc revenu au marron-gris », explique le journaliste du Monde.

Un choix de couleur explicitement éditorialisé que certains médias, comme France Télévisions, ne peuvent pas faire. « Nous sommes le service public, il est donc pour nous hors de question de prendre ce genre de décision », explique Arnaud Vincenti.

Au choix éditorial s’ajoutent plusieurs contraintes techniques. Les rédactions doivent harmoniser les couleurs entre leur site web, leur application mobile, et le cas échéant, leur version imprimée. Au Monde, les couleurs des encres du print, moins précises que le sur le web, obligent les infographistes à choisir des tonalités franches. Pas de bleu marine, qui pourrait être confondu avec le bleu des Républicains.

Il est parfois difficile de trouver une solution définitive. Emeline Gaube, datajournaliste pour le site web de BFMTV, jongle avec les couleurs pour ses infographies. « Je change de couleurs selon mes besoins, explique-t-elle. Si j’utilise déjà une palette de bleu pour François Fillon, je dois trouver autre chose pour le FN. Je mets parfois Marine Le Pen en noir quand j’ai besoin d’une grande palette de nuances ».

Mais les couleurs du Front national, comme celles d’En Marche !, s’harmoniseront sans aucun doute au fil des prochaines élections, surtout si ces partis s’installent durablement dans le paysage politique.

Macron : quelle couleur pour le « ni droite, ni gauche » ?

La réelle nouveauté de cette élection présidentielle est l’arrivée du nouveau mouvement En Marche ! sur la scène politique. Un nouveau casse-tête pour les graphistes. « Globalement, j’essaye de respecter la couleur des logotypes des partis, poursuit Emeline Gaube, de BFMTV. Mais Emmanuel Macron n’a pas vraiment de couleur définie, son logo est noir et blanc ». Dès lors, quelle couleur choisir pour un mouvement qui ne souhaite pas être identifié sur l’axe traditionnel droite/gauche ?

Comment les médias représentent Emmanuel Macron ?

Le Monde Le Figaro France Info

Média Couleur utilisée pour la présidentielle 2017
Libération
Le Parisien
AFP
La Croix

Pour Jules Bonnard, datajournaliste à l’AFP, « il fallait tenir compte du positionnement politique inédit d’Emmanuel Macron. Le jaune que nous avons choisi est aussi parfois la couleur donnée aux partis régionalistes lors des élections locales. » Et, à l’AFP, les choix chromatiques sont d’autant plus important que ce sont ceux que Google utilise pour afficher les résultats directement dans son moteur de recherche.

Une grande partie des médias a opté pour différentes variantes de jaune et d’orange. Une couleur qui place En Marche ! dans la continuité (chromatique, du moins) du parti centriste du Modem, dont le logo est orange.

Deux médias au moins font exception. Le Parisien a choisi le violet, opportun mélange entre le rouge de la gauche et le bleu de la droite. Une couleur également envisagée par les équipes du Monde, « mais on utilisait déjà cette couleur pour Nicolas Dupont-Aignan », explique Jérémie Baruch, des Décodeurs. Autre exception à la règle du jaune : France Info, qui a opté pour un gris clair. Si la couleur est souvent associée à l’absence de données, Arnaud Vincenti, de France Télévisions, assume totalement la décision. « Nous avions pensé à la tonalité parme, mais elle servait déjà pour le décor de plateau lors des primaires. Le orange était déjà utilisé pour le Modem. Et nous nous réservons le jaune comme couleur non-éditoriale (comme pour l’abstention ou la participation, par exemple). Donc nous avons opté pour le gris », détaille-t-il.

Pour lui, le gris correspondrait aussi à la volonté d’En Marche ! de ne pas être identifié à un camp politique traditionnel. « Le gris clair, c’est aussi une couleur un peu virginale : celle d’un parti en construction », conclut Arnaud Vincenti.

Brice Le Borgne (daltonien)

[Article] Conseil d’ami : informez vous ailleurs que sur Facebook

Hier, je parlais avec un ami sur Messenger, le service de chat de Facebook, de la venue d’une représentante d’Israël à une conférence. Quelques minutes plus tard, j’allais sur Facebook et parmi les publications sponsorisées, j’ai vu passer une pub pour un job en Israël.

L’effet de bulle de Facebook n’est plus à démontrer. Merci les cookies, merci tous les petits robots qui scrutent nos agissements sur les Internets du web mondialisé. Sauf que quand ça s’applique à l’information, ça pose question : est-ce que ça vous convient de n’être confronté qu’à des articles qui ne sont sélectionnés que parce qu’ils correspondent à ce que vous aimez ?

15211513_10211401220685338_1005494050_n
Donc là j’ai mis une photo de bulle pour illustrer l’idée, tavu. Et pour que cette légende serve à quelque chose, je vous recommande le travail photographique de Melvin Sokolsky que vient de me faire découvrir un ami. Bisou

Le sujet a vastement été débattu, notamment à la suite de l’élection de Trump. Pour ceux qui veulent un peu de lecture, voici :

Face à la sélection faite par Facebook, le fait de « liker » un média ne suffit donc pas pour voir tous les articles qu’il publie. Mais vous me direz que Facebook est pratique : on a tous nos médias préférés au même endroit.

Brace yourself : il existe des plateformes pour rassembler justement tous les articles de vos médias favoris, sans être l’otage de la cuisine de Facebook. J’utilise depuis quelques temps Feedreader, un agrégateur de flux RSS, dont je vous propose ici un petit aperçu.

Les flux RSS existent depuis le début des années 2000 et sont super pratiques : il s’agit d’une liste d’informations sur les modifications d’un site, à laquelle on peut accéder une fois qu’on a activé le flux. En gros, il s’agit d’une notification envoyée à chaque fois qu’un article est publié.

Une version simple de Feedreader est disponible en ligne, il s’agit de Feedreader Online. Des versions téléchargeables, de ce programme ou d’autres, sont disponibles et sûrement plus élaborées. Une fois votre compte créé, vous pouvez vous abonner aux médias que vous désirez, en cliquant simplement sur « Add a new feed ».

feed1

J’ai par exemple créé une catégorie Actu, qui rassemble les flux du Monde, Médiapart ou du Guardian. Dans le screenshot ci-dessus, c’est le fil du Monde qui est sélectionné. Je vois ainsi les articles passer quand ils sont mis en ligne, avec un résumé et un lien pour chacun. Rien de bien sorcier.

J’utilise Feedreader depuis peu, et je ne sais absolument pas s’il existe des services gratuits qui font un meilleur taf. Mais il a le mérite d’avoir accès à une certaine exhaustivité des articles publiés sans avoir à consulter plusieurs sites différents.

Si vous avez d’autres conseils pour percer la bulle, partagez les.

Photo: Parce que c’est teeellement bon d’être une beeelle famille de blancs, blonds aux dents resplendissantes. Aucun rapport, sinon.

[Data] 2017. Ce que les QG de campagne disent des candidats

Cet article a été réalisé dans le cadre de mes études. Il avait pour objectif premier de tâter des objets multimédias. J’ai essayé d’en faire quelque chose d’intéressant, mais je ne suis pas encore satisfait du rendu final. C’est un travail que je continuerai dans quelques mois, quand tous les candidats à l’élection présidentielle seront déclarés.

Mercredi 16 novembre, Marine Le Pen inaugurait son siège de campagne pour la présidentielle. Les journalistes ont pu découvrir le nouveau logo du parti, et beaucoup ont repris un élément de communication de l’équipe frontiste: leur quartier général est situé “à 1,7 km seulement de l’Elysée”.

Les candidats et leurs équipes de communicants semblent friands de symboles comme celui-ci. Alors, faisons parler les QG des candidats. Nous avons ici recensé les sièges de campagne des principaux candidats, et dont les adresses sont disponibles (tout est dispo et sourcé ici). Suivez le guide.

(l’interactif ci-dessous ne peut pas s’afficher correctement sur mon blog, cliquez sur l’image pour y accéder)

storymap

La surface des QG, repérée dans différents articles de presse, varie de 60 m² pour Arnaud Montebourg, dans le XVè, à 1 000 m² pour Emmanuel Macron.

graph-surface

Il est intéressant de noter que la plupart des QG de campagne sont situés rive-gauche, et parfois dans les quartiers huppés. Seuls Marine Le Pen et Jean-Luc Mélanchon font exception. Le siège de campagne de la première est toutefois situé rue du Faubourg Saint-Honoré, à deux pas des Champs-Elysées… Pour un emplacement « proche du peuple » et anti-système, il faudra repasser. Jean-Luc Mélenchon, lui, s’est installé aux abords de la gare du Nord, sans que l’on connaisse l’adresse exacte.

En étudiant le loyer médian de chaque arrondissement (données du 1er trimestre 2016 disponibles ici), on constate que bon nombre de QG des candidats de droite se trouvent dans des arrondissement où le loyer médian est plus élevé.

Pour autant, corrélation n’est pas causalité. Il est facile d’imaginer que d’autres facteurs entrent en ligne de compte (proximité avec l’Assemblée nationale, avec le QG du parti, disponibilité de grandes surfaces, centralité…). Idéalement, quand j’aurai plus de temps, je croiserai l’emplacement des QG avec d’autres statistiques sûrement disponibles. Un travail qui sera intéressant à mener une fois que les candidats aux différentes primaires seront désignés et quand tous les QG seront connus.

D’ailleurs, dans cette enquête, je n’ai pas pu intégrer les QG de tous les candidats. Le siège de campagne de Yannick Jadot (EELV) n’est pas encore connu. Il devrait être dans le siège du parti, mais celui-ci doit prochainement déménager à Montreuil, à une adresse encore inconnue.

Quant à Jacques Cheminade, il garde l’emplacement de son QG secret….

cheminade2.gif

[Data] Pressbook: cellule data du Parisien

J’ai passé mon été 2016 au sein de la cellule data et innovation du Parisien, journal de presse quotidienne régionale. Au fil des 7 semaines de stage et de la cinquantaine de travaux que j’ai réalisé, j’ai pu m’initier aux aspects techniques du datajournalisme et les approfondir. Il est clair qu’entre le début et la fin de mon stage, ma boîte à outil s’est clairement étoffée, en allant d’Excel à Javascript en passant par Sublime Text, les expressions régulières ou le scraping.Voici un recueil des quelques travaux dont je suis plutôt satisfait.

  • L’évolution du taux de chômage par zone d’emploi.

L’INSEE a livré les données du chômage depuis 2003. C’est un jeu de données très intéressant à deux titres. D’abord parce que les données sont par trimestre depuis 2003, donc précises dans le temps. Et ensuite, parce qu’elles sont précises dans l’espace, puisque le chômage est donné par zone d’emploi (il en existe environ 300 en France, et correspondent à des rassemblements de communes, pour faire court), ce qui permet de relier un chiffre à une situation économique hyperlocale. On a donc tourné et retourné ces données pour passer d’un tableau de 300 lignes et 50 colonnes, pleines de chiffres, à une information intéressante pour les lecteurs. Le service éco a pu lancer des reportages dans les zones où le chômage avait le moins augmenté, et nous, on a pu faire un papier résumant partiellement nos conclusions. Et un beau gif.

gif

Depuis 2013, la SNCF tient à jour un registre des objets trouvés, actualisé en temps réel (pensez-y si vous perdez quelque chose dans une gare ou un train 😉 ). J’ai donc fouillé cette base de donnée, à l’échelle française et parisienne, pour me rendre compte qu’on perd des snowboards en été, 316 bagues, ou des déambulateurs. C’est du data léger, c’est du datalol.

Après les attentats de Nice, je me demandais si l’union nationale, ce moment ou les politiques ne tapent pas sur le pouvoir en place pour respecter un moment de recueil, se réduisait. J’ai déjà écrit un post de blog à ce sujet (voir L’union nationale n’existe pas), en plus de l’article publié dans la version print du journal.

dsc08034

Au milieu de l’été, Valls a lancé un débat sur la possibilité de financer des lieux de culte via le denier public. Levée de bouclier à droite et à gauche. Nous avons donc eu l’idée de voir quelle part de la réserve parlementaire partait dans des projets de restauration/entretien/gestion de lieux de culte, qui peuvent en même temps être des lieux culturels. La distinction est fine, mais quand on voit qu’un député finance la mise en place d’une sono dans une église d’un village de 1500 habitants, difficile de croire à l’argument culturel. Bref, un travail de recherche intéressant, de l’investigation data comme on aime. Enquête passée dans le print également.

dsc08035

En juillet dernier, à la suite de la tentative de coup d’Etat, la Turquie annonçait qu’elle allait déroger aux droits de l’homme, comme le prévoit l’article 15 de la Convention européenne des Droits de l’Homme – et comme l’a fait la France en 2015. Pour tenter une mise en perspective historique de cette actualité, j’ai recensé toutes les fois ou un pays signataire de la CEDH a annoncé une telle dérogation temporaire. J’ai aussi fait une comparaison européenne du nombre de violation des droits de l’homme, pour laquelle la Turquie arrive en tête. Cela étant, ce travail a plusieurs limites méthodologiques.

Quelques jours avant l’ouverture de Rio 2016, une étude d’Oxford estimait le dépassement du budget des JO de 50%. C’est grave, surtout pour un pays en faillite, mais c’est une donnée à mettre en perspective avec les autres jeux: en moyenne depuis 1976, les budgets sont dépassés de 193%.

  • Mais aussi…

La carte française des attaques de loups, des feux de forêts dans le sud de la France depuis 1985, la carte des villes ayant pris un arrêté anti-burkini, le score des Français aux JO, … la liste ne peut être exhaustive (et ne serait pas forcément très intéressante).