Skip to navigation – Site map

HomeNuméros56Notes de lectureCéline Poudat et Frédéric Landrag...

Notes de lecture

Céline Poudat et Frédéric Landragin, Explorer un corpus textuel : Méthodes – pratiques – outils

Louvain-la-Neuve, De Boeck Supérieur, 2017, 240 p.
Eva Schaeffer-Lacroix
Bibliographical reference

Céline Poudat et Frédéric Landragin, Explorer un corpus textuel : Méthodes – pratiques – outils, Louvain-la-Neuve, De Boeck Supérieur, 2017, 240 p.

Full text

1L’ouvrage Explorer un corpus textuel : Méthodes – pratiques – outils de Céline Poudat et de Frédéric Landragin a paru en mars 2017. Les auteurs visent un public d’étudiants en sciences du langage, mais aussi tout étudiant ou chercheur d’une autre discipline intéressé par l’analyse des données textuelles à l’aide des outils et méthodes de la linguistique de corpus.

2Les auteurs ont pour objectif « d’expliquer de manière progressive et pédagogique ces méthodes de la linguistique outillée qui sont orientées vers l’exploration de corpus, et donc vers l’accès aux données, leur visualisation, le calcul de statistiques » (p. 10). Il ne s’agit pas d’une annonce vaine : le style est limpide et abordable tout en restant scientifiquement valide. Certains éléments ou caractéristiques sont évoqués de façon brève parce que la connaissance de leur existence est considérée comme une condition pour la bonne compréhension de la suite ; citons comme exemple le langage SQL (Structured Query Language) dont on se contente de mentionner l’existence et l’importance (p. 23), ce qui est suffisant dans le cadre posé par les auteurs.

3On peut également lire que le propos des auteurs « ne relève pas de la technique : il est méthodologique avant tout et vise à fournir des repères sur le fonctionnement des outils en général, et non sur l’utilisation de tel ou tel outil particulier » (p. 10). Il ne s’agit visiblement pas de présenter toutes les fonctionnalités d’un outil d’exploration de corpus en particulier. On peut tout de même constater qu’au fil du texte, des noms d’outils sont cités, certains principalement pour illustrer un point précis (Glozz ou Annis). D’autres comme TXM ou IRaMuTeQ apparaissent de façon récurrente ; de plus, en annexe, un paragraphe descriptif leur est dédié. Le lecteur désireux d’approfondir ses connaissances sur l’un ou l’autre outil est invité à lire certains des ouvrages ou articles cités dans Poudat & Landragin (2017). Il est également recommandé de consulter les synthèses descriptives attestant des usages d’outils d’exploitation de corpus par la communauté francophone, publiées en ligne par Céline Poudat pour le compte du groupe de travail Exploration de corpus du consortium CORLI (CORpus, Langues, Interactions), affilié à la très grande infrastructure de recherche des humanités numériques Huma-Num.

4Afin de compléter les suggestions des auteurs, on peut proposer la lecture du livre Discovering English with Sketch Engine de James Thomas (2017) pouvant convenir aux personnes désirant connaitre le système de gestion de corpus Sketch Engine qui a des vertus pédagogiques avérées. N’oublions pas de mentionner les autres moyens de s’informer sur l’un ou l’autre outil de façon exhaustive et conviviale : des manuels en ligne (CQPweb et TXM), des tutoriels filmés (Corpus-Workbench, 2012-2017) et des listes de diffusion (Corpus, TXM).

5En conclusion, les auteurs rappellent les principes qui sous-tendent la rédaction de l’ouvrage et qui caractérisent leur positionnement général : des méthodes d’exploration de corpus répandues et ayant fait leurs preuves dans la communauté francophone et au-delà, le choix de logiciels libres, l’insertion dans des communautés de chercheurs comme le consortium CORLI, et une clarté dans le propos pour donner aux lecteurs novices l’occasion de progresser dans un domaine en pleine expansion. On y apprécie le rappel de certains débats encore actuels, en particulier celui autour du sens de l’annotation : « […] l’idée de décompter ce que l’on a annoté et déjà interprété, et de s’éloigner de la matérialité textuelle peut encore poser problème à certains. » (p. 215) Les auteurs plaident pour une meilleure coopération entre communautés travaillant sur l’annotation et communautés spécialistes en exploration quantitative des données (p. 215). Le développement de formats standards, par exemple pour les annotations de type XML-TEI, est également considéré comme une urgence.

6Pour finir, on peut saluer la publication de cet ouvrage qui soutient parfaitement une évolution nécessaire, à savoir la banalisation des méthodes et outils de corpus dans le monde de la recherche.

Top of page

References

Electronic reference

Eva Schaeffer-Lacroix, “Céline Poudat et Frédéric Landragin, Explorer un corpus textuel : Méthodes – pratiques – outilsLidil [Online], 56 | 2017, Online since 01 November 2017, connection on 11 December 2024. URL: http://0-journals-openedition-org.catalogue.libraries.london.ac.uk/lidil/4720; DOI: https://0-doi-org.catalogue.libraries.london.ac.uk/10.4000/lidil.4720

Top of page

About the author

Eva Schaeffer-Lacroix

ESPE de l’académie de Paris, Université Paris-Sorbonne, CeLiSo

By this author

Top of page

Copyright

The text and other elements (illustrations, imported files) are “All rights reserved”, unless otherwise stated.

Top of page
Search OpenEdition Search

You will be redirected to OpenEdition Search