1Dans le cas de cette enquête sur le blog, le recours à des analyses de statistique textuelle a eu plusieurs avantages. Cela a d’abord constitué une aide importante à l’interprétation de ce corpus de taille conséquente (voir Tableau de présentation du corpus, infra). Repérer les répétitions, cooccurrences et distances entre les termes employés permet de rendre compte des registres narratifs et argumentatifs à l’œuvre sur le blog, et d’évaluer la part dévolue à l’expression des souvenirs, à la mobilisation mémorielle ainsi qu’à d’autres thèmes moins immédiatement perceptibles à la lecture.
- 1 De manière non exhaustive, on peut citer les articles de Matthieu Paldacci sur des blogs (2006), de (...)
- 2 La lemmatisation consiste à substituer une forme par une autre plus réduite, en remplaçant un pluri (...)
- 3 Ces analyses n’ont cependant pas été reproduites dans cette annexe.
2C’est le sens de la méthode « Alceste » mise au point par Max Reinert (2007), et utilisée par de nombreux travaux en sociologie1. Le logiciel utilisé, ici Iramuteq, la version open-source d’Alceste développée par Pierre Ratinaud, établit d’abord un dictionnaire des formes du corpus, qu’il lemmatise2. Le corpus est initialement subdivisé en sous-corpus, ici les textes d’articles et de commentaires issus du blog. Ces textes connaissent ensuite un second découpage en segments d’une dizaine de mots. La méthode de Classification descendante hiérarchique permet d’identifier les répétitions et proximités entre les formes contenues dans les segments de texte, et d’en répartir la plus grande partie au sein de classes. Les classes sont ici créées de manière descendante, de manière à ce que « chaque ensemble soit le plus homogène possible en termes de vocabulaire utilisé et le plus différent possible de l’autre groupe » (Beaudouin & Pasquier, 2014, p. 135). Une analyse factorielle des correspondances est ensuite produite, ce qui permet d’analyser les relations entre les classes de vocabulaire qui ont été dégagées3.
3Il ne s’agit donc pas d’une procédure fondée sur une grille analytique préconçue : les classes de vocabulaire sont distinguées indépendamment de mots-clés qu’aurait pu identifier le chercheur. Ce dernier peut néanmoins introduire des variables pour préciser des éléments sur l’auteur des textes et le contexte dans lequel ils ont été produits. Ces variables (dites variables étoilées), intégrées dans la constitution du corpus, n’ont qu’une valeur illustrative, et n’interfèrent pas dans l’analyse. Dans le cas de l’enquête sur le blog, cette fonction m’a permis de repérer les différences de pratiques entre blogueurs et de les contextualiser. J’ai donc utilisé des variables temporelles indiquant la période de rédaction des articles et commentaires, le nom de l’auteur (en regroupant plusieurs catégories d’auteurs entre elles lorsque cela était nécessaire), son genre (pour le corpus constitué par les commentaires) et le nombre de commentaires (pour le corpus constitué par les articles). Lorsque cela a été possible, le profil des auteurs a été complété par des informations obtenues lors d’entretiens et d’observations. Des calculs sur la spécificité du vocabulaire associé à chaque modalité de ces variables ont été effectués. Il faut aussi préciser qu’Iramuteq, comme Alceste, prête attention à l’identification des marqueurs grammaticaux, et à leur sur- et sous-représentation dans chaque classe, ce qui donne dans une certaine mesure accès au « processus d’écriture » (Truc, 2011, p. 33) du texte (présence plus ou moins importante d’adjectifs, de pronoms personnels, de verbes …). Enfin, j’ai réalisé plusieurs séries de statistiques descriptives à l’aide du logiciel R.TeMiS développé par Gilles Bastin et Milan Bouchet-Valat (2014) pour représenter les logiques de distribution et d’évolution temporelle des corpus et pour mesurer la taille des commentaires et articles en fonction de leurs auteurs. Ces analyses m’ont notamment permis de repérer des profils distincts de blogueurs que j’ai ensuite pu contacter « hors ligne » afin de réaliser avec eux des entretiens. Dans les résultats qui suivent, j’ai rendu invisibles la plupart des prénoms et noms de blogueurs mentionnés, en remplaçant seulement les noms des personnes que je cite dans l’article par leurs pseudonymes. J’ai également changé plusieurs éléments concernant le nom de la cité.
Éléments de présentation des corpus
Corpus Articles : N = 206
|
Corpus Commentaires : N = 5750
|
71 959 occurrences
7090 formes
3342 hapax (4.64%des occurrences et 47.14% des formes)
Moyenne de 349.32 occurrences par texte
|
538 510 occurrences
21 100 formes
10 597 hapax (1.97% des occurrences et 50.22% des formes)
Moyenne de 93.65 occurrences par texte
|
20 formes actives les plus fréquentes (effectif) :
cité (459), blog (194), Nanterre (188), souvenir (175), enfant (171), pont (166), abdenbi (155), bidonville (155), famille (150), vie (149), temps (148), mémoire (140), histoire (132), grand (121), Viaduc (121), transit (113), aller (111), voir (108), passer (107), premier (105)
|
20 formes actives les plus fréquentes (effectif) :
Famille (2022), aller (1873), ami (1469), voir (1415), grand (1346), souvenir (1317), blog (1279), cité (1148), petit (1116), salam (1111), frère (1034), jour (967), passer (923), karim (875), allah (831), enfant (812), monde (797), Nanterre (794), venir (783), temps (765)
|
4
Graphique 1 : Évolution du nombre de commentaires par mois (2012-2014)
5
Graphique 2 : Évolution du nombre d’articles par mois (2012-2014)
6Les analyses conduites permettent de repérer plusieurs lignes de distinction entre les auteurs d’articles et de commentaires. En premier lieu, les textes des articles sont sensiblement plus longs que ceux des commentaires, et ils contiennent proportionnellement plus de mots longs et très longs (voir Tableau 1). Ce résultat est à mettre en relation avec les trajectoires de mobilité sociale ascendante des auteurs d’articles décrites dans le texte. L’analyse de classification descendante hiérarchique montre ensuite que la distinction entre articles et commentaires recoupe des principes importants de différenciation des mondes lexicaux du blog. Les première et seconde classes, liées aux commentaires, s’opposent en effet aux quatrième et troisième classes, liées aux articles (voir Graphique 3). Aux différences de fond et de forme entre ces classes, que j’explicite dans le texte, s’ajoutent des écarts de participation entre blogueurs : les femmes ont tendance à s’investir davantage dans l’écriture de commentaires, et les hommes dans l’écriture d’articles (voir Graphique 4). On repère également des différences à l’intérieur de ces catégories, avec des auteurs très caractéristiques de chacune des classes (voir Figure 1). Enfin, on peut noter que la troisième classe est celle qui rend le plus explicitement compte de la vocation mémorielle du blog, alors qu’elle n’est pas centrée sur les souvenirs du passé des blogueurs mais sur l’hommage à Abdenbi Guemiah (voir Graphiques 5 et 6).
Tableau 1 : Tableau lexical des textes selon leur type (par document)
|
Moyenne de termes
|
Pourcentage de hapax
|
Pourcentage de mots longs
|
Pourcentage de mots très longs
|
Longueur moyenne des mots
|
Articles
|
324,7
|
37,8
|
27,9
|
6,9
|
5
|
Commentaires
|
85,4
|
52,1
|
21,2
|
4,1
|
4,7
|
Moyenne du corpus
|
Moyenne du corpus
|
205
|
69,3
|
20,6
|
4,3
|
4,7
|
7
Figure 1 : Classification descendante hiérarchique des segments d’articles et de commentaires
En italiques : formes supplémentaires dans l’analyse (mots outils et variables étoilées)
8
Graphiques 3 à 6 : Chi2 par classe des modalités des variables « type de texte », « sexe de l’auteur », et des formes « mémoire » et « blog »
9
10
11
12Comme je le montre dans le texte, la participation est bien plus diversifiée dans le corpus des commentaires que dans celui des articles, ne serait-ce qu’au seul niveau du nombre d’auteurs (voir Tableaux 2 et 3). Différentes analyses permettent d’expliciter davantage les lignes de clivage qui structurent l’écriture de commentaires.
13Le sexe des auteurs est une variable centrale : les écarts sont importants en ce qui concerne le volume de commentaires publiés (69% le sont par des hommes, voir Tableau 4) ainsi que les formes et les registres de la participation (voir Encadré). Alors que les hommes écrivent des textes se caractérisant par des formes collectives d’interpellation et par la référence à des liens et espaces extra-familiaux (ami, municipal, public, quartier), les femmes utilisent davantage de pronoms personnels (on, je) et convoquent dans leurs textes de liens familiaux (fille, mari, mère, maman) (voir Tableau 4). Il ne faudrait cependant pas tirer de ces résultats une vision trop figée des rôles genrés qui se sont constitués sur le blog. Si la contribution des femmes à l’entreprise est le plus souvent invisible, comme je le montre dans l’article, certaines contributrices ont pu être mises en avant par les administrateurs pour leur proximité avec le projet initial du blog. C’est le cas de Latifa, qui publie un nombre limité de commentaires (93) mais qui est la blogueuse qui rédige le plus d’articles, juste derrière Karim et Ali. Dans ses écrits, elle retrace avec précision et sensibilité la vie au quotidien dans les bidonvilles et cités de transit, ainsi que le parcours migratoire de la famille (voir Encadré). Un de ses textes, récompensé lors d’un jeu-concours organisé par le blog, fait le récit de son propre parcours tourné vers l’ascension de ses enfants par l’école, à qui Latifa tente de donner l’instruction qu’elle n’a pas eue. Elle promeut de la sorte une narration et des valeurs qui sont très proches de celles qu’espéraient les administrateurs au début du projet.
14Cette adéquation au projet initial est très liée à des dynamiques de positionnement social. Dans les commentaires de Karim, Ali et Samir (voir Encadré), qui ont connu les ascensions sociales les plus marquées, on remarque une tendance à se focaliser sur la mise en œuvre de l’entreprise numérique (Ali), sur l’exposition documentée des conditions de vie passée (Karim), et sur un débat d’idées plus général autour de l’exclusion en France (Samir). Les commentaires de ces trois auteurs sont également de taille sensiblement plus conséquente, et ils intègrent davantage de mots longs et très longs que les autres (voir Tableau 5).
15Des expériences militantes antérieures peuvent cependant conduire des auteurs disposant de peu de capital culturel à se mobiliser politiquement et à s’intégrer à l’entreprise animée par Karim et Ali. C’est le cas d’Ibrahim dont les textes montrent une capacité très forte à politiser l’hommage à Abdenbi (légitime, maire, exploitation, revendication, voir Encadré).
16La participation en ligne est enfin loin d’être équivalente à la participation hors ligne. Hakim, dont les commentaires reflètent surtout une insertion dans les échanges de sociabilité et de salutation quotidiens(voir Encadré), est en fait l’un des blogueurs les plus mobilisés hors ligne, dans les réunions, pour aider à la préparation et à l’installation du matériel lors d’événements, et sur d’autres scènes syndicales et politiques.
Tableau 2 : Effectifs et pourcentages cumulés d’articles par auteur
Auteurs
|
Articles
|
%
|
% cumulés
|
laredaction
|
105
|
50,7
|
50,7
|
Karim
|
38
|
18,4
|
69,1
|
Ali
|
19
|
9,2
|
78,3
|
Ali et Karim
|
1
|
0,5
|
78,7
|
Latifa
|
13
|
6,3
|
85
|
Samir
|
10
|
4,8
|
89,8
|
[nom de bloggeur]
|
6
|
2,9
|
92,7
|
Extérieur
|
5
|
2,5
|
95,2
|
[nom de blogueuse]
|
3
|
1,4
|
96,6
|
[nom de blogueur]
|
2
|
1,0
|
97,6
|
[nom de blogueur]
|
1
|
0,5
|
98,1
|
Rabia
|
1
|
0,5
|
98,6
|
Farid
|
1
|
0,5
|
99
|
[nom de blogueur]
|
1
|
0,5
|
99,5
|
[nom de blogueuse]
|
1
|
0,5
|
100
|
Total
|
206
|
100
|
|
17
Tableau 3 : Effectifs et pourcentages cumulés de commentaires par auteur
Auteurs
|
Effectif
|
%
|
% cumulés
|
Hakim
|
552
|
9,6
|
9,6
|
Fred
|
544
|
9,5
|
19,1
|
Ibrahim
|
413
|
7,2
|
26,2
|
Karim
|
356
|
6,2
|
32,4
|
Meryem
|
324
|
5,6
|
38,1
|
[nom de blogueur]
|
280
|
4,9
|
42,9
|
Fatima
|
229
|
4,0
|
46,9
|
Samir
|
167
|
2,9
|
49,8
|
Rabia
|
165
|
2,9
|
52,7
|
[nom de blogueur]
|
161
|
2,8
|
55,5
|
Ali
|
145
|
2,5
|
58,0
|
[nom de blogueuse]
|
126
|
2,2
|
60,2
|
Farid
|
105
|
1,8
|
62,0
|
Latifa
|
93
|
1,6
|
63,7
|
[nom de blogueuse]
|
82
|
1,4
|
65,1
|
10a19
|
328
|
5,7
|
70,8
|
61a79
|
303
|
5,3
|
76,1
|
2a4
|
259
|
4,5
|
80,6
|
50a69
|
243
|
4,2
|
84,8
|
21a30
|
230
|
4,0
|
88,8
|
unique
|
217
|
3,8
|
92,6
|
31a49
|
214
|
3,7
|
96,3
|
5a9
|
214
|
3,7
|
100,0
|
Total
|
5750
|
100
|
|
18
Tableau 4 : La participation aux commentaires selon le sexe
Hommes
|
Femmes
|
3 972 commentaires (69% du total)
|
1 778 commentaires (31% du total)
|
24 hommes ont rédigé plus de 20 commentaires entre 2012 et 2014 (plus de 80 : 9 hommes)
|
15 femmes ont rédigé plus de 20 commentaires entre 2012 et 2014 (plus de 80 : 6 femmes)
|
En moyenne, textes de 80 mots (+ de hapax, mots longs et très longs)
|
En moyenne, textes de 90 mots
|
Termes les plus caractéristiques : asalam, arleikom, ami, d, un, car,, ici, par, l, nôtres, dans, [nom de blogueur], de, cher, tres, espagnol, municipal, salut, ça, rmou, public, quartier, baroudeur (Chi2 entre 59 et 9)
|
Termes les plus caractéristiques : on, cela, ne, je, espérer, fille, tout, toujours, me, monde, embrasse, pré, pas, aleikoum, très, faire, mari, mère, tm, souvenir, gens, rire, maman (Chi2 entre 54 et 9)
|
19
Tableau 5 : Tableau lexical des commentaires selon différents profils d’auteurs (moyennes par document)
|
Nombre de termes
|
Pourcentage de hapax
|
Pourcentage de mots longs
|
Pourcentage de mots très longs
|
Longueur moyenne des mots
|
Profil d’études secondaires et/ou supérieures, professions intellectuelles et supérieures
|
Samir
|
156,9
|
59,3
|
30,1
|
9,9
|
5,5
|
Karim
|
75,2
|
70
|
31,5
|
10,1
|
5,2
|
Ali
|
73,7
|
66,6
|
30,2
|
10
|
5,2
|
Profil d’absence d’études secondaires, professions d’exécution dans le domaine des services
|
Rabia
|
61,3
|
66,4
|
22,6
|
5
|
4,8
|
Ibrahim
|
47,7
|
73,3
|
23,4
|
5,2
|
4,8
|
Hakim
|
43,1
|
75,2
|
22,4
|
7
|
5
|
Moyenne du corpus
|
Moyenne du corpus
|
82,4
|
77,8
|
26,7
|
7,5
|
5,1
|
20
Encadré : Spécificités des commentaires selon leurs auteurs
Ali : article, nous, blog, participation, également, questionnaire, ou, bienvenue, vos, Meryem, anecdote, effectivement, effet, apprécier, 3ème, génération, blogueurs, réponse, [nom de blogueur], recevoir, ton, celles, de, suivant, agir, discussion, nostalgie, [nom de blogueur], poster… (Chi2 entre 18 et 5)
Karim : de, doute, cliché, d, l, photo, bâtiment, jamaa, rédaction, bienvenue, logement, sans, quant, bât, prochainement, par, haj, nombreux, celle_ci, cage, complice, ces, élève, désormais, évidemment, [nom de blogueur], dont, escalier, sur, poursuivre… (Chi2 entre 48 et 9)
Samir : [ses initiales], e, par, citoyen, lorsque, d, doux, samir, exclusion, cette, agréable, de, l, population, public, dans, injustice, s, seulement, proposer, idée, sembler, solidarité, politique, devoir, les, qui, expression, proposition, élu… (Chi2 entre 31 et 7)
Ibrahim : halikoum, nôtres, nots, salem, frère, amicalement, ami, [son nom de famille], halakoum, u, suivre, abdenbi, désolé, mon, légitime, pour, maire, leurs, nôtre, exploiter, revendication, et, te, monsieur, inch_allah, souhaiter, sur, remerci, nôtres, mois… (Chi2 entre 103 et 8)
Hakim : arleikom, était, avoir, rmou, ça, étais, très, espère, sœur, frère, lol, ole, salut, j’espère, [nom de blogueur], [nom de blogueuse], aujourd’hui, ah, ma, tu, été, tchao, j, voiler, après, années… (Chi2 entre 276 et 16)
Farid : [son nom], Farid, biz, citer, ami, [nom de blogueur], bonjour, qrp, 30 ans, notre, calife, histoire, bonsoir, sauver, mére, jouer, Nanterre, arc, alias, enfant, l, construire, travers, voiler, andalousie, 0, apres, [nom de blogueur], ou, cote… (Chi2 entre 73 et 4)
Fred : ça, être, y, j, ici, c, aussi, là, hermana, il, un, voilà, m, sûr, quelqu’un, je, chose, soir, quand, espagnol, moi, olé, Espagne, mais, aller quelqe, en, Fatima, on, où… (Chi2 entre 167 et 13)
Fatima : on, cela, ne, tout, monde, toujours, souvent, il, pas, faire, qu, gens, pré, aller, quand, là, je, falloir, dire, ils, mari, moi, hermano, fois, espérer, manger, fred, seine, devoir, bord… (Chi2 entre 147 et 14)
Latifa : bidonville, même, les, eau, madame, bois, baraque, leurs, femme, être, cour, rahmo, ruelle, soleil, beurre, nos, cantonnier, vie, neige, sac, nous, mur, étaient, méditerrannée, berge, coter, tête, charbon, interdire, midi… (Chi2 entre 21 et 5)
Meryem : je, ça, très, toi, tu, Hakim, trop, me, j, affectueusement, [nom de blogueur], embrasse, el, [nom de blogueuse], Karim, te, souvenir, t, [nom de blogueuse], avouer, merci, reposer, [nom de blogueuse], connaître, haj, presque, espérer, [nom de blogueuse], tellement… (Chi2 entre 23 et 6)
Rabia : you, salem, tm, amine, me, tous, ses, [nom de blogueur], [nom de blogueur],mr, vous, [son nom de famille], merci, et, bravo, [le nom de famille d’Ali et Karim], Abdenbi, [nom de blogueuse], blogueurs, encore, ali, mes, grave, [nom de blogueuse], tousser, bisou, famille, pensée, dieu, [nom de blogueur]… (Chi2 entre 66 et 6)
21