- 1 Outre-atlantique, l'enquête Pew Research (2020) indique que plus d'un quart des adultes ont recours (...)
- 2 Certains auteurs les nomment « vidéastes », « youtubeurs », « youtubeurs-actu », « influenceurs »… (...)
1Dans le cadre d'un processus plus large de plateformisation de l'information (Rebillard & Smyrnaios, 2019) et d'un déplacement important des pratiques informationnelles vers les réseaux sociaux numériques1 (RSN) (Pew, 2018 ; 2020), nous assistons à l'essor de nombreux créateurs de contenus proposant une analyse, un traitement, un décryptage de l'actualité politique. Qu'il s'agisse d'HugoDécrypte, de Tatiana Ventôse, de Juste Milieu ou d'Antoine Léaument, ces producteurs de contenus2 peuvent analyser la réforme des retraites, les présidentielles ou encore la guerre en Ukraine au travers de vidéos faisant, pour les plus visibles d'entre eux, des centaines de milliers de vues et réunissant des millions d'abonnés. Ces producteurs se caractérisent par un certain nombre de choix éditoriaux, comme l'usage fréquent de prises de vue face cam (Assilaméhou-Kunz & Rebillard, 2022) afin de s'adresser directement aux audiences, ou la forte personnalisation de leur production (même quand ils sont soutenus par des équipes prenant en charge l'écriture, le montage ou l'animation de la communauté), dessinant un « technogenre prescrit » (Paveau, 2017 ; Combe, 2019).
2Pourtant, au-delà de la forte proximité des formats, ces producteurs se structurent au confluent d'univers médiatiques différents, interrogeant les limites, les frontières et les recouvrements de leurs différentes activités. Trois perspectives sont particulièrement saillantes. Tout d’abord, ces créateurs prolongent les transformations de l'activité journalistique (Goasdoué, 2015 ; Germain & Alloing, 2022) dans la mesure où plusieurs d'entre eux se revendiquent journalistes à titre individuel, se présentent en collectif comme des « médias indépendants » (Canard Réfractaire, Le Fi d'Actu) ou des « médias alternatifs » (Ferron, 2016), et ont suivi des formations journalistiques (comme Salomé Saqué). Au sein des plateformes numériques, telles que YouTube, TikTok ou Instagram, quelle place ont ces créateurs de contenus par rapport aux médias traditionnels ?
3Une partie conséquente de ces producteurs se situe également dans un soutien militant à certains partis politiques (comme Antoine Léaument pour la France Insoumise) ou à certaines idéologies, ou au contraire se définissent plutôt par leur opposition à ces institutions politiques (Giry, 2017 ; Theviot, 2019 ; Bristielle, 2020), ce qui renouvelle un certain nombre d'interrogations sur le militantisme en ligne, dans la continuité notamment du travail de Cardon et Granjon (2010) sur le médiactivisme. Dans quelle mesure certains producteurs de contenus sont-ils structurellement proches de la plateforme des partis politiques et de leurs représentants ?
4Enfin, dans un contexte plus large de défiance envers les médias traditionnels et de « désenchantement » (Badouard, 2017) du rapport à l'information, ces producteurs s'inscrivent également dans un travail de médiation : nombre d'entre eux se présente comme des accès facilités, simplifiés, à la connaissance du monde politique (c’est le cas par exemple d’HugoDécrypte), avec des acteurs qui déclarent, pour certains, s'adresser spécifiquement aux jeunes, aux moins politisés et moins enclins à consommer les médias traditionnels d'information, et se définissent comme étant des vulgarisateurs de savoirs, à l’image de ceux qu’on retrouve par exemple pour les sciences du vivant ou les mathématiques. Ces nouveaux formats accompagnent la transformation du paysage médiatique traditionnel qui a vu l'essor de l'info-divertissement afin de rendre la politique « populaire » (Brants, 2003 ; Leroux & Riutort, 2013). Comme pour les émissions de talk-show français ou américain, ces producteurs de contenus semblent pour certains évacuer « la question de la connivence par un statut extérieur aux mondes politique et journalistique » (Le Foulgoc, 2017 : paragr. 2), se rapprochant des univers de l’entertainment.
5Comment peut-on penser la segmentation et la structuration du champ de ces producteurs de contenus politiques sur YouTube, alors même que ces derniers se situent au croisement de nombreux univers, entre politique, journalisme, vulgarisation et divertissement ? Cet article propose de répondre à cette question par le recours à des outils de cartographie de données issues de YouTube. Dans le cadre du bilan proposé par le numéro sur l’évolution des approches méthodologiques pour les études du numérique, il offre une réflexion détaillée sur les enjeux et limites de ces outils, ainsi qu’une description détaillée de leur combinaison dans le but d’appréhender ce mélange des styles caractéristiques aux producteurs de contenus YouTube et leurs emprunts à différents genres médiatiques.
6Peu de travaux ont tenté de proposer une vue d’ensemble de ces producteurs de contenus. Certains se sont penchés sur des chaînes en particulier, en se focalisant sur les partis d'extrême droite (Lefébure, 2022) et d'extrême gauche (ou gauche radicale) (Theviot, 2019 ; Bristielle, 2020). Il en est de même pour les déploiements numériques de certains médias, comme Valeurs Actuelles (Marty et al., 2022). En revanche, les producteurs de contenus, hors partis politiques et hors déclinaison de médias plus traditionnels, font l'objet d'une attention plus récente. Ces travaux se concrétisent notamment par des études de cas (Combe, 2019 ; Assilaméhou-Kunz & Rebillard, 2022), qui laissent de côté l'étude du panorama plus large de ces créateurs de contenus politiques. On peut souligner une exception notable : le travail réalisé par Benbouzid et al. (2020) proposant une étude de l'espace médiatique et politique de YouTube (et donc pas seulement les créateurs de contenus qui m'intéressent ici) à partir d'une analyse en composante principale classant en différentes catégories les chaînes identifiées. La construction du corpus des chaînes étudiées est pourtant peu explicitée : on sait notamment qu'une première liste a été établie à la main, que des outils de crawling ont permis l'ajout de nouvelles chaînes, et que le tout a été complété par les données d'une entreprise privée, mais nous avons peu de détails sur les arbitrages effectués. Comment identifier ces producteurs de contenus politiques, réunis autour de certains formats ? Comment les situer les uns par rapport aux autres ? Quelle place ont ces acteurs dans l'espace médiatique actuel ? Comment rendre compte de cet espace médiatique ?
7En démarrant ce projet de recherche, le premier réflexe a été d'explorer les différentes plateformes étudiées pour rechercher et lister les acteurs les plus importants par une sélection « manuelle ». Mais l'exploration de ces plateformes laisse toujours d'innombrables acteurs dans l'ombre : l'exposition aux différents créateurs de contenus est fortement dépendante des algorithmes de suggestion, que ce soit sur la page d'accueil ou au sein des vidéos suggérées, avec une grande difficulté à saisir comment ces algorithmes encadrent les usages (Airoldi et al., 2016 ; Rieder et al., 2018). Rieder (2018) montre ainsi comment YouTube semble favoriser les contenus natifs, qui sont bien plus exposés que les contenus des acteurs médiatiques traditionnels. Les modes plus classiques d'ethnographie en ligne se heurtent à une inévitable singularisation des conditions de navigation par les algorithmes (Drumond et al., 2018) : en fonction à la fois des précédentes vidéos vues, de la date de la consultation, des contenus récents plus ou moins mis en avant, etc., ce ne sont pas les mêmes vidéos qui seront mises en avant. De plus, il existe une très forte hiérarchie de la visibilité sur ces plateformes (Cha et al., 2007), faisant qu'un nombre très restreint d'acteurs concentre à lui seul une part très importante à la fois des vues, des participations (likes, commentaires, partages, etc.) et des revenus. Il existe pourtant une multitude d'acteurs de taille intermédiaire, cumulant des centaines de milliers d'abonnés, étant de fait moins visibles à l'échelle macro de la plateforme. Il fallait donc trouver une façon d'identifier ces acteurs intermédiaires.
- 3 L'extraction des vidéos se fait avec le concours de l'INALab dans le cadre de leur mission au titre (...)
8Pour ce faire, mon travail propose de mobiliser des outils numériques permettant de cartographier ces espaces et de situer les différents acteurs les uns par rapport aux autres, en prenant ici le cas particulier de YouTube. Au sein de ce projet, l'usage de la cartographie est double. Il s'agit d'une part d'identifier les acteurs qui produisent ces contenus d'analyse politique sur les plateformes, leur identification permettant par la suite d'organiser une extraction massive des contenus pour construire un corpus de vidéos3. Il ne s'agit pas tant d'être exhaustif, surtout dans un contexte d'apparitions et de disparitions constantes de ces acteurs, mais plutôt de parvenir à les saisir dans leur diversité. À ce titre, l'extraction et la cartographie sont surtout utilisées comme étape intermédiaire à d'autres traitements.
9Deuxièmement, il s'agit de proposer des représentations graphiques de ces espaces en assumant le « bricolage » méthodologique inhérent à ce type de méthode, en mobilisant conjointement de l'analyse visuelle des réseaux (Venturini et al., 2021) et des méthodes de clustering. En montrant à la fois les nombreuses itérations dans la construction des corpus afin d’identifier des figures récurrentes, il s'agit de proposer une représentation synthétisant les lignes de forces et le partitionnement des acteurs. Au final, cet article vise à rendre compte de la « cuisine interne », des bricolages méthodologiques et des nombreux arbitrages qui doivent être faits, depuis la phase d'extraction des données jusqu'à la représentation des données, en passant par tous les traitements intermédiaires.
10Les outils de cartographie, et notamment à partir des données de réseaux sociaux ou de données du web, se sont démocratisés, en particulier au début des années 2010 (Eve, 2002 ; Bastian et al. ; 2009, Mercklé, 2011). Mais la place de ces outils d'analyse des réseaux est encore très ambivalente dans la boîte à outils des chercheurs en sciences sociales. Tout d'abord, ils ne font pas l'objet de conventions précises permettant de standardiser leur usage, entraînant la coexistence de pratiques très variées, depuis les formes les plus exploratoires (notamment par la visualisation des réseaux) jusqu'aux formes les plus proches des méthodes quantitatives classiques (en se focalisant sur des indicateurs produits, et peu sur la représentation), en passant par de nombreuses formes intermédiaires tentant de concilier les deux.
11La posture la plus souvent conseillée (Boullier et al., 2016 ; Venturini et al., 2021) reste de mobiliser ces outils de façon plutôt inductive, exploratoire, de façon à formuler des hypothèses de recherche qu'il faudra valider par d'autres techniques d'enquête, plutôt que de répondre à des hypothèses par l'analyse de réseau. Certains auteurs estiment ainsi que « dans la préhistoire des sciences du Web dans laquelle nous nous trouvons, il serait nécessaire de parvenir à produire des protocoles d'exploration et des tests de robustesse qui deviennent des prérequis pour toute exploration de ces données » (Boullier et al., 2016 : paragr. 31). Peut-on seulement arriver à des conventions partagées lorsque l'objet même de ces spatialisations change en fonction des données récoltées, de la nature des liens et des nœuds, des modes d'extraction, etc. ? Or, peu de travaux rendent compte précisément de cette « cuisine interne » qui consiste à explorer des espaces virtuels par ces outils. L'objectif de cet article est donc de rendre compte du travail, souvent invisible, qu'il est possible de mener grâce à ces outils cartographiques, et de faire apparaître les nombreux arbitrages effectués. Il s'agit notamment de montrer l'importance des itérations, par essai-erreur, effectuées afin d'ajuster les modes de sélection. De fait, la méthode choisie repose pour beaucoup sur une longue phase exploratoire, largement facilitée par ces outils numériques permettant une forte sérendipité : les outils permettent de limiter la place du hasard tout en favorisant des « découvertes heureuses », validées par de nouvelles explorations. Le recours même à ces outils, au-delà du résultat final, contribue ainsi fortement « en soi » à la connaissance de l'espace étudié et permet de penser plus finement la relation (proximité/distance) entre les différents acteurs.
12L'usage des outils numériques se fait ici en prenant le parti de défendre un usage « mixte » (quali-quanti) des données extraites et mises en forme pour construire le corpus (ou plutôt les corpus). Il n'est a priori pas possible de construire ce corpus uniquement à partir d'un protocole purement quantitatif ou statistique sans risquer de retenir de nombreuses chaînes hors sujet. Le protocole mis en place doit permettre de valider les chaînes retenues en fonction des formats proposés. En même temps, il faut avoir accès à une vaste sélection de chaînes susceptibles de faire partie du corpus et d'en diversifier la composition. Comment construire cet équilibre entre qualité et quantité ?
13Je propose ici un protocole permettant une construction pas à pas, prise par prise, de l'objet de recherche. Ce protocole se déploie en quatre étapes, qui consistent à :
141. Identifier des grandes familles d'acteurs et des premières lignes de force par une première cartographie exploratoire ;
152. Structurer la récolte par la construction de trois proto-corpus thématiques permettant de faire des explorations plus approfondies ;
163. Ordonner les chaînes des proto-corpus, caractériser les chaînes les plus importantes de chaque réseau et effectuer une sélection manuelle selon les propriétés formelles des contenus par une analyse qualitative ;
174. En prenant les chaînes identifiées comme point de départ, proposer une représentation des chaînes les plus visibles sur la plateforme, en tenant compte à la fois des suggestions faites par la plateforme et des abonnements des usagers à certaines chaînes.
- 4 Depuis le 29 septembre 2023 le module en question a été modifié suite à la suppression de l’API « r (...)
18Pour cela, je mobilise deux outils. Le premier s'appelle YouTube Data Tools (YDT). Il a été créé par Bernhard Rieder (2015) afin de permettre l'extraction de données par l'API de Youtube à partir de différents modules. Deux d'entre eux ont particulièrement retenu mon attention. Un premier module permet l'extraction d'un réseau de vidéos considérées comme « proches » (related to) des vidéos initiales par l'algorithme de YouTube4. Cette « proximité » s'avère être une boîte noire pour le chercheur, et implique de se limiter aux informations fournies par YouTube. Néanmoins, cette proximité semble contribuer à la construction des suggestions en marge des pages et à la suite de chaque vidéo. Ces algorithmes, malgré leur opacité, présentent l'avantage à la fois d'être partiellement construits sur les usages passés mais également d'encadrer et d'orienter les usages à venir. À défaut d'un panel renseignant sur l'exposition réelle à des vidéos suggérées, il s'agit d'une façon d'approcher en partie l’éditorialisation des contenus réalisée par la plateforme. Un deuxième module permet l'extraction d'un réseau de chaîne auxquelles les comptes sondés sont abonnés (subscriptions). En s'abonnant à une chaîne, les usagers sont de fait plus exposés aux vidéos de la chaîne en question, que ce soit sur la page d'accueil, sur la page « abonnements » et même en marge d'autres vidéos.
19Que ce soit pour les « vidéos proches » ou les « abonnements », deux points de départ sont possibles : soit une recherche par mots-clés, soit à partir d'un corpus défini en amont, de vidéos ou de chaînes, selon les modules. Dans les deux cas toujours, il est possible d'explorer de 0 à 1 ou 2 degrés, c'est-à-dire de répéter l'opération pour les voisins et les voisins des voisins au sein du réseau, ce qui mécaniquement tend à créer des réseaux exponentiels. Le recours à ces deux outils fait d'autant plus sens que le travail précédemment cité de Benbouzid et al. (2020) montre que « tout porte à croire que la visibilité de ces chaînes soit produite par les abonnements et/ou par la dimension personnalisée de la recommandation, deux modes d'accès à la visibilité qui interagissent et se renforcent mutuellement », qui sont les deux principaux mécanismes mobilisés par ces modules. Ainsi, les représentations graphiques proposées ici ne sont pas tant des représentations des usages (faute d'avoir accès à des données réelles de navigation), mais sont plutôt une façon d'approcher la visibilité des différentes chaînes au sein de la plateforme.
20Le deuxième outil mobilisé est Gephi (Bastian et al., 2009). Il s'agit du logiciel libre de référence en visualisation de réseau. Gephi permet la production de variables supplémentaires autour des réseaux formés par les chaînes et les vidéos YouTube, en plus d'en permettre la visualisation.
21Comment parvenir à identifier les différents acteurs du décryptage politique sur les plateformes ? La méthode proposée ici consiste à mutualiser différents corpus de façon à cumuler à la fois des différents modes d'extraction des données et différents points de départ.
22Il a fallu de très nombreuses extractions et de nombreux traitements sur plusieurs bases intermédiaires pour arriver, par itération, à construire le protocole final. Les toutes premières extractions ont été effectuées à partir d'une dizaine de chaînes déjà connues, notamment des Youtubeurs les plus célèbres dans le commentaire de l'actualité politique (HugoDécrypte, Usul, Tatiana Ventôse, Osons Causer, parmi d'autres). Après avoir sélectionné des vidéos de ces producteurs, il s'agissait d'utiliser le module permettant d'identifier des vidéos « proches » (conseillées par l'algorithme de YouTube), et d’extraire les vidéos à deux degrés (les vidéos proches, et les vidéos proches des vidéos proches…). Il fallait pour cela identifier en premier lieu des vidéos à partir desquelles l'outil allait explorer. Le choix opéré a été de prendre comme point de départ pour chaque chaîne la vidéo faisant le plus de vues sur les six derniers mois précédant la date d’extraction et consistant en une analyse ou un commentaire de l'actualité politique. Par exemple, je n'ai pas retenu les vidéos de comptes-rendus de manifestation, en revanche j'ai gardé les vidéos faisant du commentaire facecam ou les interviews des personnalités au sujet d'une actualité de la vie politique. Le réseau de vidéos ainsi obtenu est en revanche peu lisible : j'ai donc plutôt utilisé le réseau des chaînes, où chaque lien correspond à une vidéo d’une chaîne considérée comme « proche » par l'algorithme de YouTube. Cette première cartographie m'a permis de saisir un très large ensemble d'acteurs et de les intégrer à leur tour dans des extractions ultérieures. Mais comment être certain d'avoir bien saisi l'ensemble des producteurs de ces contenus d'analyse politique ? Comment consolider l'identification de ces acteurs ?
Figure 1 - Schéma résumant le protocole d'identification et de cartographie des producteurs de contenus d'analyse politique sur YouTube
23Afin de dépasser cette première cartographie exploratoire, il fallait pouvoir identifier un certain nombre d'acteurs servant de point de départ à l'extraction de données. Une première étape a consisté à procéder à la construction de 3 proto-corpus thématiques permettant d'identifier différents acteurs. Il ne s'agit plus ici de partir de chaînes identifiées, mais de simuler une recherche par mot-clé et de circuler à partir des vidéos proposées par la recherche sur YouTube, en circulant de « proche en proche ». Les résultats de la recherche simulée par l'outil sont équivalents aux 100 premières vidéos, classées par ordre de « pertinence », étant là-encore un critère propre à YouTube, qui conditionne la visibilité des vidéos. Pour chaque vidéo de la recherche par mot-clé, 50 vidéos « proches » sont extraites. Puis l'opération est renouvelée une seconde fois pour l'ensemble des nouvelles vidéos identifiées.
24Le premier corpus (A) a été extrait en juin 2022 à partir du mot-clés « législatives » au lendemain des élections (Fig. 2.). Le second corpus thématique (B) a été extrait en février 2023 à partir des mot-clés « réforme retraite » (Fig. 3.). Enfin, le dernier corpus (C) a été extrait en mars 2023 à partir des mot-clés « guerre Ukraine » (Fig. 4.). Comme pour la cartographie exploratoire, les données récoltées concernent les liens entre les vidéos, mais les représentations créées mobilisent les chaînes elles-mêmes comme nœud.
25Si les acteurs principaux restent présents et visibles au sein des trois corpus (notamment les grands médias, les partis politiques, les principaux youtubeurs), la place et la visibilité des différents acteurs intermédiaires varient. Le corpus B présente une nette surreprésentation des chaînes marquées à gauche (Osons Causer, Canard Réfractaire, Usul, etc.), signe déjà que la thématique est plus ou moins traitée selon l'orientation politique. Le corpus C autour de la guerre en Ukraine est lui bien plus marqué par la présence importante d'acteurs de la droite radicale et de l'extrême droite. Le corpus A à partir de la recherche autour des élections législatives semble être dans une situation intermédiaire.
- 5 Le calcul de modularité permet de construit des clusters en fonction des liens existants entre les (...)
26Les différents corpus obtenus ont tous fait l'objet d'un traitement très similaire une fois passés sous Gephi, ajustant simplement les échelles appliquées en fonction de la taille des corpus, de façon à rendre l'ensemble le plus lisible possible. Tous les graphes ont été spatialisés à l'aide de l'algorithme Force Atlas 2 et les nœuds ont été colorés à partir de calcul de modularité5 proposé par Gephi. J'ai pris le parti de ne pas afficher sur les représentations graphiques les liens entre les nœuds, très denses et s'affichant sous forme de « hairballs ». Seuls les noms des nœuds – et donc des chaînes – apparaissent en fonction de leur degré (le nombre de liens entrants ou sortants), rendant plus facile l'exploration et la lecture des graphes.
27La dernière étape consiste alors à mutualiser les corpus pour identifier les acteurs pertinents. Les corpus obtenus comportent pour les plus restreints plus de 7000 chaînes, pour les plus étoffés plus de 32 000 chaînes (et plusieurs centaines de milliers de vidéos lorsqu'on affiche les données initiales), ce qui rend peu envisageable une exploration à la main. Comment identifier les acteurs sans rentrer dans un travail titanesque de vérification ligne par ligne des productions de chaque chaîne listée ? Une difficulté en particulier s’ajoute : les acteurs qui m'intéressent sont souvent de taille intermédiaire par rapport à d'autres comptes, notamment ceux des médias traditionnels. Autant les grands comptes médiatiques sont presque toujours visibles d'une représentation à une autre, autant certains acteurs qui m'intéressent peuvent vite être invisibilisés. Pour se faire, j'ai donc ordonné les corpus par degrés (en fonction du nombre de liens entrant, c'est-à-dire le nombre de fois qu'une vidéo de la chaîne a été considérée comme proche d'une autre vidéo), et j’ai établi un seuil à partir duquel je pouvais procéder à une vérification manuelle des chaînes.
28Cette vérification manuelle consiste à vérifier à la fois la ligne éditoriale de la chaîne, les formats proposés, le nombre d'abonnés, l'ancienneté, le nombre de vidéos produites, le nombre de commentaires reçus, l'auto-description faite par les acteurs de leur propre chaîne, parmi d'autres éléments. L'intégration d'une chaîne ou non repose là encore sur un ensemble d'arbitrages : faut-il intégrer au corpus une chaîne dont les formats sont pertinents mais qui ne poste plus de nouvelles vidéos depuis plusieurs années ? Ou bien intégrer des chaînes pour lesquelles les vidéos de commentaire ou d'analyse de l'actualité politique ne constituent qu'un format minoritaire ? Là encore, il faut établir des seuils de sélection dont la pertinence ne s'éprouve qu'au fil du travail effectué sur les bases de données et les représentations.
29Si les 100 premières lignes des corpus extraits permettent de repérer de nombreuses chaînes pertinentes, ce taux diminue très rapidement en descendant parmi les chaînes moins centrales au sein de chaque réseau. Faire varier les corpus conduisait donc à retrouver systématiquement les acteurs les plus visibles d'un corpus à l'autre, mais en modulant la présence d'acteurs un peu plus marginaux. En tenant compte du nombre de nouvelles chaînes découvertes susceptibles de rentrer dans le corpus, j'ai fixé un seuil de vérification systématique aux 500 premières lignes de chaque corpus. Une fois une chaîne caractérisée pour le corpus A, j'ai reporté ce travail de catégorisation pour le corpus B, faisant qu'une partie importante du travail était déjà effectué, et ne laissant qu'un moins grand nombre de chaînes à caractériser. Puis j'ai reporté une nouvelle fois la caractérisation des chaînes co-présentes d'un corpus à l'autre pour le dernier corpus. D'itération en itération, le nombre de chaînes identifiées est passé de 9 initialement à plus de 120 chaînes proposant un travail d'analyse de l'actualité médiatique, et formant le corpus final des acteurs jugés pertinents.
30Il est impossible de pouvoir considérer que l'extraction a inventorié à un instant T tous les producteurs de façon exhaustive, mais plusieurs indices laissent penser qu'à défaut d'être forcément tous identifiés dans le corpus final, ils sont a minima présents dans les proto-corpus. En effet, aucun acteur jugé pertinent dans la constitution du corpus final n'était absent d'un proto-corpus à l'autre. En revanche, les comptes étaient plus au moins centraux, plus ou moins faciles à voir sans passer par une phase de vérification systématique des milliers ou dizaines de milliers de comptes récupérés. Ce qui peut signifier que, étant donné le nombre de producteurs de ce type de contenu, les comptes pertinents sont tous présents, mais qu'il faut organiser un travail de filtrage pour les faire ressortir.
Figure 2. Proto-corpus A (législatives). 7691 nœuds et 38880 liens
Figure 3. Proto-corpus B (réforme des retraites). 8935 nœuds et 98894 liens
Figure 4. Proto-corpus C (guerre Ukraine). 7749 nœuds et 59737 liens
31A partir du corpus ainsi établi des Youtubeurs faisant du traitement de l'actualité politique (n=127), il a été ainsi possible de produire deux autres cartographies, ne visant plus cette fois à identifier de nouveaux acteurs, mais bien à proposer des représentations graphiques de cet espace.
32Une première cartographie (Fig. 5. à partir d'un corpus D) reprend le système des vidéos « proches ». J'ai actualisé la toute première cartographie exploratoire effectuée, non plus à partir de la dizaine de chaînes identifiées au début de la recherche, mais bien à partir des 127 chaînes du corpus final. J'ai procédé ensuite de la même façon, en identifiant des vidéos qui servent de point de départ au crawling. On retrouve assez logiquement les éléments structurants déjà présents dans les trois proto-corpus précédents, puisqu'il s'agit de la même méthode d'extraction de données, mais à plus large échelle.
33La deuxième cartographie (Fig. 6. à partir d'un corpus E) part du réseau des abonnements pour ce même corpus final, en récupérant les comptes auxquels les chaînes identifiées sont abonnées, puis en répétant l'opération là encore à deux degrés. La cartographie obtenue est bien plus large, plus diversifiée, que celles obtenues par les vidéos « proches », avec des univers bien plus segmentés. Dans cette cartographie d’ensemble, le réseau n’est pas aussi centralisé que pour les extractions par « vidéos proches ». En revanche, une zone précise de cette carte regroupe la quasi-totalité des acteurs centraux des précédents corpus. On peut faire l'hypothèse ici que les vidéos considérées comme « proches » et les réseaux de chaînes auxquels les individus sont abonnés tendent en réalité à rapprocher structurellement les mêmes chaînes.
34Entre ces deux cartographies, on peut remarquer que les médias traditionnels qui n’ont pas forcément investi YouTube pour poster des contenus originaux mais qui postent de nombreux contenus produits pour la télévision (BFM, Europe 1, France 24, LCI par exemple) sont bien moins présents dans la cartographie des abonnements alors qu’ils sont centraux dans la cartographie des vidéos proches. On peut faire l’hypothèse que les contenus de ces grands médias sont plus facilement proposés comme suggestion, poussée notamment par l’algorithme de YouTube, même si les usagers tendent moins à s’abonner à ces chaînes. A l’inverse, la cartographie des abonnements juxtapose un ensemble de chaînes très marquées à gauche (regroupées ici dans un cluster en rouge, et comportant notamment Jean-Luc Mélenchon, Médiapart, Blast, Arte, Osons Causer, etc.) avec un autre ensemble de chaînes davantage situées à droite et à l’extrême droite (regroupées ici dans un cluster bleu, avec notamment J’suis pas content TV, Le Media Pour Tous, Le Raptor) alors que les médias généralistes sont bien plus en retrait. La cartographie des abonnements fait ainsi ressortir des chaînes plus polarisées sur un plan politique, et on peut faire l’hypothèse que cela tient aux logiques affinitaires des abonnements, car les usagers s’assurent de suivre certains comptes avec lesquels leurs opinions politiques sont alignées, quand la visibilité des comptes des grands médias traditionnels dépend plus de l’actualité.
35Si, comme le concluent Benbouzid et al., (2020) la visibilité sur YouTube tient aux effets croisés de la recommandation et des abonnements, alors proposer une cartographie qui rende compte des deux effets peut permettre d'approcher une représentation donnant une appréhension des chaînes que la plateforme rend visibles lorsqu'il s'agit des producteurs de contenus d'analyse politique et de leurs chaînes voisines. D'où l'idée de proposer une cartographie en fusionnant les deux corpus. La difficulté posée est celle de la pondération des liens qui conditionnent la taille des nœuds : un lien d'abonnement peut-il être considéré comme étant équivalent en termes de poids à un lien selon le modèle de la « vidéo proche » ? Il a été décidé ici d’accorder la même pondération aux deux types de liens.
Figure 5 - Réseau des chaînes à partir des vidéos proches pour les 127 chaînes du corpus. 7171 nœuds et 120710 liens.
Figure 6 - Réseau des abonnements à partir des 127 chaînes du corpus. La représentation ci-dessous est un zoom dans la cartographie originelle, bien plus étendue. 23403 nœuds et 324553 liens
Figure 7. Cartographie hybride (corpus D et E). 13649 nœuds et 159738 liens
36Après avoir multiplié les points de vue, travaillé ces espaces à la fois par l'exploration des bases de données, des représentations graphiques, et après avoir proposé une dernière représentation hybridant à la fois les liens par abonnements et les liens selon les vidéos « proches » (Fig. 7), que peut-on dire de cet espace des producteurs d'analyses politiques sur YouTube et des chaînes proches ?
- 6 Calcul de modularité, résolution 0.8.
37De fait, l’hybridité des positions de ces producteurs de contenus entre journalisme, militantisme politique, vulgarisation et divertissement apparait nettement par le travail de cartographie opéré, permettant de situer ces producteurs au sein de différents continuums. La lecture à la fois par l'analyse visuelle de réseau et par les outils de clustering6 permet de former des groupes très cohérents, que ce soit en termes de nature, d'organisation de la production audiovisuelle, de format, de tonalité et de positionnement politique, formant des ensembles qui prolongent assez directement les résultats de Benbouzid & al. (2020). Premièrement, on retrouve en bleu la présence manifeste dans un premier cluster des grands médias (Europe 1, BFM TV, France 24, etc.), qui sont évidemment particulièrement centraux, et autour desquels s'organisent les autres chaînes qui les commentent. De fait, les producteurs de contenus qui m'intéressent produisent rarement leurs propres reportages, et s'appuient significativement sur les images des médias traditionnels. Ils forment à ce titre des chambres d’écho qui amplifient, transforment, détournent les messages initiaux pour alimenter leur propre système à la fois économique et attentionnel. Un deuxième cluster en vert regroupe des chaînes documentaires, au sein desquels on ne trouve presque pas de chaînes qui correspondent éditorialement au format retenu pour le corpus mais qui peuvent en revanche traiter d'enjeux politiques.
38En rouge, on trouve un cluster (3) très marqué à gauche, avec une déclinaison entre une partie très affiliée à la gauche mélenchoniste (Jean-Luc Mélenchon lui-même, Adrien Quatennens, Mathilde Panot, Manon Aubry, etc.), de quelques médias traditionnels identifiés à gauche (Médiapart, France Culture), et de chaînes proposant des contenus natifs (BLAST, Pure Politique, Thinkerview). Plus les chaînes de ce cluster 2 sont dans la partie supérieure de la cartographie, plus elles sont éloignées des logiques partisanes traditionnelles, et plus elles se rapprochent également de chaînes situées à l'extrême-droite, sans passer par des acteurs des partis traditionnels de gauche et de droite. C'est notamment le cas de Tatiana Ventôse et du Fil d'Actu, appartenant au cluster 3, étant de fait une ancienne secrétaire du Parti Radical de Gauche, mais ayant depuis évolué pour se rapprocher de positions plus proches de celles de Zemmour. Dans cette zone intermédiaire, on retrouve plusieurs chaînes qui font plutôt du commentaire de l'actualité, avec un recours prononcé à l'humour, au sarcasme et plus généralement au pathos (Juste Milieu, Maudin Malin), qui ressemblent à plusieurs égards au cas décrit par Finlayson (2022) en décrivant le cas du youtubeur britannique Paul Joseph Watson comme étant lui aussi en dehors des partis politiques, et maniant un mélange de divertissement et de théorie politique en empruntant des éléments de langage à la fois aux libéraux et aux conservateurs. Ces créateurs, parfois difficiles à étiqueter politiquement selon les critères traditionnels se caractérisent plutôt par une ligne souverainiste, anti-européenne, et globalement critique du milieu de la « politique politicienne ».
39Deux clusters en particulier semblent regrouper principalement des chaînes de droite radicale et d'extrême-droite, opposant notamment des chaînes plus institutionnelles et plus proches des formats médiatiques classiques (interviews, reportages, etc.) (cluster 4 en noir, avec Sud Radio, la Chaîne Officielle de TV Liberté, Ligne Droite, la matinale de Radio Courtoisie) à des chaînes reprenant plus directement les codes propres à YouTube, avec des formats souvent plus humoristiques, sarcastiques, contestataires (cluster 5 en vert sapin avec notamment Psyhodelik, VA Plus, Stéphane Edouard, etc.). A noter notamment l'appartenance de la chaîne Touche Pas à Mon Poste à ce cluster, bien qu'étant éloignée des autres chaînes sur la représentation graphique, ce qui peut s'expliquer à la fois par le traitement humoristique qui est fait de la politique et la tendance à mettre en avant certaines personnalités d'extrême-droite (Sécail, 2021), bien qu'appartenant aussi au groupe des émissions télévisées.
40Le cluster 6 regroupe des chaînes plus proches des enjeux de vulgarisation et qui tendent à vouloir s'éloigner des perspectives militantes et partisanes (HugoDécrypte, Gaspard G, Jean Massiet) et qui revendiquent une certaine forme de neutralité (dont on peut discuter de la pertinence), bien qu'étant nécessairement éditorialisées.
41Ces quatre clusters (3, 4, 5 et 6) sont ceux qui concentrent le plus grand nombre de producteurs de contenus de « décryptage » et d'analyse de l'actualité politique, principalement porté par l’extrême droite (notamment des soutiens de Marine Le Pen et Eric Zemmour) et la gauche radicale (tout particulièrement autour de la France Insoumise). La droite traditionnelle est peu présente sur ces réseaux, de même que l’extrême gauche (notamment communiste, trotskiste, etc.). Les représentants du gouvernement sont également très peu présents sur ces réseaux. On peut faire l’hypothèse que YouTube est un lieu permettant principalement à des médiactivistes (Cardon & Granjon, 2010) de construire un contre-discours et de se considérer comme des alternatives aux médias traditionnels, mais surtout aux discours partisans et de gouvernement.
42Les outils de cartographie à partir des données des plateformes numériques font l'objet de nombreuses controverses sur les façons à la fois de récolter les données et de proposer des représentations graphiques. Cet article était l'occasion de proposer un protocole d'enquête qui tente à la fois de prolonger les travaux faisant de ces outils une voie d'accès au terrain mais également de proposer une représentation d'un espace numérique s'appuyant sur un ensemble de corpus, en travaillant par itération et par convergence de faisceaux d'indices. Les représentations graphiques restent le fruit d'une longue série d'arbitrages qu'il s'agissait ici de décrire et de justifier avec précision afin d’expliciter cette « cuisine interne » qui est d'ordinaire invisibilisée. Les vertus de ces méthodes pour explorer un terrain sont indéniables et déjà largement soulignées dans plusieurs travaux, bien que difficiles à objectiver. Par un usage mixte des données récoltées, à la fois quantitatif et qualitatif, j'ai proposé un protocole permettant de construit un corpus de chaînes YouTube faisant du commentaire de l'actualité politique, avant d'en proposer une cartographie permettant de souligner à la fois les porosités entre différents univers (journalistiques et politiques notamment). Elle permet de réifier la proximité des acteurs entre eux, en particulier selon leur proximité plus ou moins grande avec des univers de références, qu’il s’agisse de la politique, du journalisme, de la vulgarisation ou du divertissement, en attendant qu’une étude des contenus et des entretiens qualitatifs avec les acteurs viennent outiller l'analyse des formats, des discours et des trajectoires professionnelles.