Navigation – Plan du site

AccueilNuméros86Exploration fonctionnelle de dict...

Exploration fonctionnelle de dictionnaires de synonymes pour un projet d’humanités numériques

Première étude comparative en vue de la sélection de ressources
Functional exploration of synonym dictionaries for a digital humanities projets. First comparative study for resource selection
Karolina Suchecka et Nathalie Gasiglia

Résumés

Les dictionnaires numériques peuvent être consultés par des outils informatiques d’extractions d’informations. Nous expérimentons cela pour un projet de littérature comparée : l’édition savante numérique d’environ 90 textes en français qui relatent le mythe d’Orphée et Eurydice, et qui présentent de ce fait des réemplois intertextuels. Parmi d’autres procédés de réécriture, nous travaillons sur les relations synonymiques. Afin d’obtenir une annotation fine des mots-occurrences (parfois très polysémiques), nous exploitons des dictionnaires de synonymie distinctive, avec l’objectif d’apparier semi-automatiquement une sélection de synonymes pertinents à chaque mot-occurrence qui peut en accepter lors du prétraitement du corpus (ce qui implique d’exploiter les sélecteurs sémantiques ou contextuels des articles de dictionnaires pour les confronter aux indices repérables dans le contexte des mots-occurrences).

Haut de page

Texte intégral

Introduction

  • 1  Schématiquement : aides à la compréhension, à l’expression ou à l’amélioration de la compétence mé (...)

1La lexicographie numérique élargit les raisons qui poussent à consulter des dictionnaires1 et en facilite de nouvelles utilisations, notamment à l’aide d’outils informatiques d’extractions ciblés d’informations. C’est ce que cet article propose d’envisager comme perspective. Nous expérimentons les possibilités offertes par le recours aux dictionnaires de synonymie numériques au sein d’un projet interdisciplinaire et proposons des pistes pour exploiter pleinement leur potentiel informationnel. Le contexte est une édition savante numérique des 94 traductions ou réécritures (41 et 53 respectivement) en français du mythe d’Orphée et Eurydice, dans laquelle nous voulons présenter les réemplois textuels détectés à l’aide d’outils informatiques. Pour ce faire, parmi d’autres procédés de reformulation, la prise en compte optimale des relations synonymiques s’avère cruciale pour améliorer la pertinence de l’appariement (semi-)automatique des réemplois présents au sein de notre corpus.

2Or, les ressources lexicales talistes utilisées pour des traitements comparables (comme WOLF2) et les méthodes statistiques (comme le « plongement lexical »3) s’avèrent peu opératoires pour ce petit corpus. Afin d’atteindre une annotation aussi fine que possible, avec des synonymes pertinents pour chaque mot-occurrence qui peut en accepter, nous nous heurtons parfois à des items très polysémiques pour lesquels les choix de synonymes à retenir peuvent manquer d’évidence, même en nous tournant vers des dictionnaires spécialisés traitant spécifiquement ces relations lexicales. En effet, notre objectif final est d’automatiser l’appariement d’une sélection pertinente de synonymes à chaque mot-occurrence lors du prétraitement du corpus, ce qui implique :

  • 4  C’est souvent une liste unique de synonymes qui est fournie dans les dictionnaires en ligne, on pa (...)

d’une part, de disposer d’un dictionnaire interrogeable par un programme et proposant des articles subdivisés en sous-listes de synonymes en fonction des emplois pour lesquels les substituts sont valides, comme ce que proposent en principe les dictionnaires de synonymie distinctive4,

et, d’autre part, de savoir exploiter informatiquement les sélecteurs sémantiques ou contextuels qui introduisent souvent les sous-listes pour les confronter aux indices repérables dans le contexte de chaque mot-occurrence à annoter.

3À défaut, l’association des synonymes pertinents devra être manuelle, mais elle restera appuyée sur des dictionnaires « bien choisis ».

  • 5  Le Dictionnaire électronique des synonymes est consultable sur le site du laboratoire CRISCO (http (...)
  • 6  Le Robert a commercialisé le Dictionnaire des combinaisons de mots (2007 et 2020) en version impri (...)
  • 7  Pour plus d’informations concernant le correcteur Antidote de Druide Informatique Inc., voir : htt (...)
  • 8  Pour plus d’informations concernant le Robert correcteur coédité par le Robert et les Éditions Dia (...)
  • 9  Toutes les URL de cette contribution ont été contrôlées le 31/07/2023.

4Après avoir présenté notre projet et les logiciels de détection des relations textuelles utilisés (§ 1.), nous évaluons la pertinence d’une méthode d’appariement simple, appuyée sur un dictionnaire de synonymie cumulative de langue générale, le Dictionnaire électronique des synonymes du Crisco5 (§ 2.). Cet outil n’est pas optimal pour notre objectif, nous le montrerons, mais il est aisé à exploiter dans une chaîne de traitements numériques et il nous fournit un point de comparaison pour la suite des expérimentations. Nous nous tournons ensuite vers trois dictionnaires de synonymie distinctive, proposés par les principaux éditeurs du marché français et dont il existe une version numérique au moins, le Dictionnaire des synonymes et nuances du Robert (2020), le Grand dictionnaire Synonymes & Contraires de Larousse (2004) et le Dictionnaire des synonymes d’Hachette Éducation (Baratin et Baratin-Lorenzi, 1996), qui proposent chacun une manière différente d’introduire des sous-ensembles de synonymes (§ 3.). Nous comparons leur potentiel pour nous aider à révéler les relations synonymiques valides dans les contextes d’emploi d’une petite sélection de mots-occurrences de notre corpus. Nous proposons enfin d’expérimenter une méthode d’appariement automatique qui exploite les sous-listes d’un de ces dictionnaires de synonymie distinctive en s’appuyant sur le repérage de cooccurrents extraits des contextes et confrontés à ceux relevés dans un dictionnaire de cooccurrence, qui ne sera pas un produit d’éditeur du secteur éditorial de la référence6 mais un dictionnaire offert à la consultation au sein de logiciels d’aide à la correction, Antidote7 et le Robert correcteur8 (§ 4.).9

1. Présentation du projet

5Le mythe d’Orphée et Eurydice est bien connu, notamment grâce aux Géorgiques de Virgile (37-30 av. J.-C.) et aux Métamorphoses d’Ovide (Ier s.), qui constituent les textes de référence majeurs quand le mythe est repris comme sujet littéraire. Mis à part quelques différences plus ou moins importantes entre ces deux sources, la trame principale reste commune : inconsolable de la mort d’Eurydice, son épouse, Orphée descend aux Enfers pour prier les dieux de la lui rendre. Émus par son chant, Hadès et Perséphone lui permettent de l’emmener, à condition qu’Eurydice marche derrière lui et que celui-ci ne se retourne pas pour la regarder. Cependant, juste avant la surface, il le fait et la perd à jamais.

  • 10  Dans cette contribution, nous transcrivons les graphies originales des textes dans les citations.

6Notre corpus10 se compose de 41 traductions en français du livre IV des Géorgiques ou des livres X-XI des Métamorphoses et de 53 réécritures – en vers et en prose, et de différents genres textuels et états de la langue – qui s’appuient souvent sur ces deux sources antiques. L’inspiration par ce mythe a, en effet, traversé l’histoire littéraire depuis le Moyen-Âge jusqu’à nos jours, que ce soit en poésie, à l’opéra ou au théâtre. Il est adapté, parodié, modernisé ou réinterprété pour un jeune public.

7Pour exploiter ce corpus hétérogène, nous comptons sur l’assistance d’outils numériques et de traitements automatiques afin de soutenir et d’amplifier notre analyse, et nous exploitons deux logiciels dédiés à la détection de relations textuelles, Tracer11 et TextPAIR12. Des techniques comme le plongement lexical ou l’alignement séquentiel (Wise, 1995 ; Bergroth, Hakonen et Raita, 2000) les rendent performants pour des relations proches (reformulation simple, paraphrase lexicale). Nous constatons néanmoins (Suchecka et Gasiglia, 2021a, 2021b, 2022) que les performances de nos deux détecteurs d’homologies sont variables et qu’ils n’exploitent que peu de connaissances linguistiques. Cela nous incite à retravailler leurs sorties, notamment en leur adjoignant des annotations lexicales, syntaxiques et sémantiques, que nous exploitons pour valider (ou pas) les correspondances qu’ils ont détectées et pour créer les représentations graphiques proposées dans notre édition savante des textes (Suchecka et Gasiglia, à paraître).

  • 13  Le XML, Extensible Markup Language, est un langage de structuration particulièrement adapté aux tâ (...)
  • 14  Pour plus d’informations sur TreeTagger, développé dans le cadre du TC project, voir http://www.ci (...)

8Les logiciels Tracer et TextPAIR retournent des couples de phrases considérées comme correspondantes. Nous balisons les constituants majeurs de ces phrases en XML13 et les enrichissons d’annotations linguistiques. Les syntagmes (comme « le profond royaume de Pluton » (Figure 1)) sont balisés comme <phr> dotés d’un @type (qui indique pour ce dernier que c’est un syntagme nominal, SN). Ils peuvent contenir des syntagmes enchâssés (ici : « Pluton », aussi annoté comme <phr>). Pour chaque syntagme, la tête lexicale est mentionnée (@select dont les valeurs respectives sont royaume et Pluton). Chaque mot contenu est balisé comme <w> et associé à son lemme (@lemma) et à sa catégorie grammaticale (@pos), les deux étant produits par TreeTagger14 puis corrigés manuellement. Les appariements des mots forts de chaque syntagme (profond, royaume et Pluton) se font au moyen d’un élément <xr> par mot d’un autre texte auquel ils sont liés (avec, pour chaque <xr>, un @corresp indiquant l’@xml:id du mot fort <w> lié, le type de lien, @type – entre mots ou entre lemmes ici –, et une évaluation de son degré de certitude, @cert). Ces annotations permettent, par l’examen du nombre et de la nature des relations lexicales au sein de chaque couple, d’écarter ceux détectés par TextPAIR et Tracer comme correspondants mais qui s’avèrent finalement liés uniquement par des mots ou expressions sémantiquement pauvres ou très fréquents, donc qui permettent mal de discriminer les contextes qu’il est pertinent de relier. Ces relations facilitent également la visualisation des couples non écartés afin de mieux évaluer l’effectivité de leur pertinence.

Figure 1. Exemple de balisage XML TEI:P5 du syntagme nominal « le profond royaume de Pluton »

9Observons concrètement un couple de correspondances (A.) détecté entre la traduction de Virgile par Charles Héguin de Guerle (Virgile, 1827, A.a.) et celle par Désiré Nisard (Virgile, 1868, A.b.).

A. Virgile, Géorgiques : Ch. Héquin de Guerle (trad.), 1827 vs D. Nisard (éd.), 1868 (avec matérialisation des formes identiques1,3-4,9,12-14,16, des lemmes identiques10,15 et des synonymes ou des reformulations polylexicales2,5-8,11,17) :

a) « Il osa1 franchir2 les gouffres3 du Ténare4, et ses forêts5 noires6 d’épouvante7, et le seuil du palais8 de Pluton9 ; aborder les Mânes10 et leur formidable11 roi12, et tenter de fléchir ces cœurs13 impitoyables que des prières14 humaines15 n’ont jamais16 fléchis17. »

b) « Il osa1 même descendre2 dans les gouffres3 du Ténare4 ; il vit le profond royaume8 de Pluton9, et ses bois5 que remplissent6.1 l’horreur7 et les ténèbres6.2, et les mânes10, et le terrible11 roi12 des enfers, et ces cœurs13 que les prières14 des humains15 n’ont jamais16 attendris17. »

  • 15  Cette relation est en fait plus complexe qu’un lien entre deux formes d’un même lemme. En effet, l (...)
  • 16  Il s’agit en réalité d’une relation dérivationnelle de conversion, entre l’adjectif qualitatif hum (...)

10Pour ces deux extraits, notre algorithme détecte 8 appariements de formes identiques (osa1, gouffres3, Ténare4, Pluton9, roi12, cœurs13, prières14 et jamais16) et 2 appariements de lemmes identiques (Mânes / mânes1015, humaines / humains1516). Toutefois, d’autres types de relations peuvent être observés :

  • 17  Dans le texte latin, nous lisons « Et caligantem nigra formidine lucum ingressus », le bois (lucum (...)

– les forêts peuvent être « noires d’épouvante » ou remplies par « l’horreur et les ténèbres », avec épouvante7 et horreur7 logiquement mis en correspondance, mais un lien apparaît aussi entre noires6 et, conjointement, ténèbres6.2 et remplissent6.1, alors que, si les ténèbres sont noires, la relation synonymique entre noir et remplir ne serait valide que dans un contexte où un espace serait saturé d’un contenu (un lieu serait noir de monde vs rempli d’une foule dense)17 ;

– les Enfers sont le seuil du palais8 ou le profond royaume8 de Pluton, qui est qualifié de roi formidable11 ou terrible11

11Les logiciels ont du mal à détecter ces reformulations, comme les métaphores et les périphrases. En revanche, certaines relations synonymiques, comme entre forêts5 et bois5, horreur7 et épouvante7 ou fléchi17 et attendri17, semblent plus aisées à identifier, « pour peu » que l’on dispose de lexiques adaptés.

12Le verbe descendre, qui nous intéressera dans la suite de cet article, est un des mots-clés les plus saillants du mythe. Très polysémique, il pose d’importants problèmes pour l’appariement des unités lexicales synonymes. Différentes traductions d’Ovide l’emploient majoritairement dans quatre contextes (Tableau 1) pour lesquels nous présentons les traductions qui utilisent descendre, combien cela représente de traductions sur les 21 du corpus et quels sont les autres équivalents traductionnels rencontrés.

  • 18  « Umbras recentes » (les ombres nouvelles) ne sont qualifiées par aucun adjectif verbal dans le te (...)

Texte d’Ovide

Exemple de traductions avec descendre et part de ce choix d’équivalent traductionnel

Autres équivalents traductionnels présentés au sein d’un exemple et part de chacun

« ad Styga Taenaria est ausus descendere porta, »

« Il ose descendre vers le Styx, par la porte du Ténare »

20/21

« il osa franchir »

1/21

« o positi sub terra numina mundi, in quem reccidimus, »

« Ô divinités du monde souterrain, où nous descendons »

8/21

« dans lequel nous retombons » (4 occ.)

« où retombe tout ce qui naît pour mourir »

« où tous les mortels sont précipitez »

« où les mortels enfin vont étoufer leurs jours »

« qui voyez tout le genre humain arriver dans ces lieux »

« où l’inflexible mort tour à tour nous attire »

« a ce submise est toute humanité » (2 occ.)

« auxquels nous appartiendrons tous un jour »

« où tout ce qui respire doit se rendre »

13/21

« Eurydicenque uocant ; umbras erat illa recentes inter »18

« Ils appellent Eurydice : elle était parmi les ombres récemment descendues »

5/21

« ombres (venues / arrivées) (nouvellement / récemment) » (8 occ.)

« ombres qui venaient d’arriver en ce lieu »

« les ombres nouvelles » (4 occ.)

« celes qui nouvelement sont venues à damptement »

« mainte ame nouvelle »

« son ombre encor recente errait parmi les ombres »

16/21

« Umbra subit terras, et quae loca uiderat ante, »

« L’ombre d’Orphée descend sous terre, et reconnaît les lieux par lui déjà visités »

13/21

« va sous les terres » (2 occ.)

« aux enfers lors s’en va »

« si-tost que la mort y fait errer son ombre »

« l’ombre d’Orphée se glissa sous terre »

« l’ombre d’Orphée devala dans les Enfers » (2 occ.)

7/21

Non traduit (« Orphée ombre là-bas »)

1/21

Tableau 1. Contextes d’emploi du verbe descendre dans les 21 traductions d’Ovide et alternatives traductionnelles

13La descente évoquée est toujours celle aux Enfers, symbolisant la mort. Dans la plupart des traductions qui n’emploient pas le verbe descendre, celui-ci est remplacé par un autre verbe de mouvement, dont deux seulement associent dans leurs sens les notions de mouvement et d’orientation de ce dernier vers le bas (dévaler et retomber – 2 sèmes communs avec descendre donc – vs (s’en) aller, arriver, (se) glisser, se précipiter, se rendre et venir – 1 sème commun). La notion de mort est introduite directement uniquement dans trois traductions : deux fois pour décrire la fonction des Enfers (« où l’inflexible mort nous attire tour à tour » et « où les mortels enfin vont étoufer leurs jours ») et une fois concernant la mort d’Orphée (« si-tost que la mort y fait errer son ombre »). Mais, dans les deux derniers extraits, la notion de mouvement est tout de même présente avec les verbes aller et errer (avec une différence : c’est la mort qui se déplace, pas un humain).

2. Méthode d’appariement appuyée sur de la synonymie cumulative

  • 19  La notion de réciprocité vient d’un posttraitement qui a consisté à rendre symétriques les relatio (...)
  • 20  La notion de clique intervient ici. « Une clique – terme emprunté à la théorie des graphes – est u (...)

14Pour expérimenter la capacité d’un traitement (semi-)automatique à détecter ce type d’équivalences, nous avons conçu initialement une méthode simple d’appariement, appuyée sur un dictionnaire de synonymie cumulative de langue générale, le Dictionnaire électronique des synonymes du Crisco (ci-après DES). Le dictionnaire est riche (plus de 50 000 entrées et 209 000 relations synonymiques réciproques19) et les corrélats les plus saillants sont classés par nombre décroissant de sens élémentaires communs20 avec la vedette (Figure 2).

Figure 2. Extrait de l’article descendre du DES21

15Nous testons notre méthode en interrogeant les 847 couples de phrases détectées comme correspondantes par les logiciels de détection des homologies, puis validées au moyen d’un algorithme de comparaison des mots forts développé pour ce projet (§ 1). Sur 8 932 relations lexicales, plus de 60 % (5 569) sont entre des formes identiques et 17 % (1 560) entre des lemmes. Les 20 % restants (1 803) sont obtenus grâce aux relations synonymiques inventoriées dans le DES. Toutefois, l’analyse de ces mises en relations révèle plusieurs problèmes.

2.1 Premier problème : traits sémantiques partiellement différents

16Sur 30 couples de phrases mises en correspondance (grâce à l’appariement d’un mot fort de chacune au moins), dont l’une des deux contient le verbe descendre, 51 appariements sont proposés, dont seulement 12 sont corrects. Nous y recensons 7 verbes (dévaler, entrer, franchir, passer, pénétrer, retomber et venir), dont les constructions sont comparables (N[+animé] V N[+lieu]) et dont aucun ne figure parmi les synonymes les plus fréquents de descendre dans le DES. Ces verbes ont des traits sémantiques partiellement différents (Tableau 2), même s’ils expriment tous le déplacement d’un humain dans les occurrences du corpus.

[vers le bas]

[volontaire]

[rapide]

[franchissant]

[pénétrant]

descendre

+

+

-

-

-

dévaler

+

+

+

-

-

entrer

-

+

-

-

+

franchir

-

+

-

+

-

passer

-

+

-

+

-

pénétrer

-

+

-

-

+

retomber

+

-

-

-

-

Venir

-

+

-

-

-

Tableau 2. Table sémique de descendre et des 7 verbes qui lui sont appariés automatiquement dans l’échantillon

  • 22  Si une construction factitive (faire V) induit une interprétation en tant qu’action involontaire, (...)

17Dévaler et retomber sont les seuls à indiquer, comme descendre, l’orientation du mouvement vers le bas, mais le second sans valeur volontaire de l’action22. Franchir et passer impliquent en plus un franchissement de quelque chose, et entrer et pénétrer une pénétration dans quelque chose. Selon le nombre de sèmes communs, il est plus ou moins difficile d’identifier une relation synonymique entre les verbes considérés seuls dans la mesure où les sujets et compléments jouent un rôle important dans l’interprétation des énoncés.

2.2 Deuxième problème : plusieurs appariements à partir des synonymes du DES pour le même mot fort

  • 23  Les 2e et 3e verbes appartiennent syntaxiquement au sujet du 1er, dont la tête est tout.

18Pire, pour certains couples d’énoncés, plusieurs appariements sont proposés pour un même mot fort. Dans les traductions des Métamorphoses d’Ovide, l’apostrophe adressée à Pluton et Proserpine par Orphée (B.) contient une occurrence de descendre dans la version de Villenave (Ovide, 1806, en B.a.) qui, lors de notre traitement, est appariée simultanément aux 3 verbes (retomber, naître et mourir) de celle de Nisard (Ovide, 1869, en B.b.)23.

A. Ovide, Métamorphoses : G. T. Villenave (trad.), 1806 vs D. Nisard (éd.), 1869 (équivalents synonymiques1) :

a) « Divinités du monde souterrain où descendent1 successivement tous les mortels »

b) « Ô divinités de ce monde souterrain où retombe1.1 tout ce qui naît1.2 pour mourir1.3 »

19Onze synonymes communs sont proposés dans le DES pour descendre et mourir. Naître se trouve parmi les synonymes de descendre et a 6 synonymes communs avec ce verbe. Retomber, qui a le moins de synonymes communs avec descendre (3), occupe pourtant la même position dans la phrase que descendre et traduit le même mot latin (recidimus).

2.3 Troisième problème : manque de prise en compte du contexte

20Enfin, certains appariements sont pertinents pour certaines occurrences, et pas pour d’autres. Pour passer, par exemple, l’appariement avec descendre fonctionne entre « passer les noirs torrents du Styx » et « descendre vers le Styx », qui expriment l’entrée aux Enfers (avec l’idée de franchissement de quelque chose pour passer et de déplacement vers le bas et en direction de quelque chose pour descendre vers), mais pas pour « passer au milieu d’un léger peuple de fantômes », qui exprime la traversée des Enfers, avec l’idée de pénétration dans une foule pour la franchir. La différence n’est donc pas uniquement liée aux sens possibles des verbes ni à leurs constructions (transitive directe pour « passer les noirs torrents du Styx » et avec une localisation introduite par vers ou à dans les deux autres exemples), mais elle l’est plutôt par l’expression des lieux eux-mêmes. En effet, la présence du cooccurrent Styx dans les deux premiers contextes invite à les rapprocher et à interpréter passer comme <franchir ce cours d’eau> et descendre vers comme <se diriger dans sa direction>.

21Nous en concluons que le fonctionnement de notre algorithme n’est pas suffisamment discriminant. En effet, au moins pour des verbes très polysémiques comme descendre ou passer, l’appariement synonymique doit prendre en compte les cooccurrents et les constructions syntaxiques qui contribuent à la construction du sens de chaque occurrence verbale.

22Si nous apprécions la richesse et la facilité d’exploitation du DES dans le cadre de traitements automatiques, son caractère cumulatif pose problème. Nous cherchons plutôt une ressource qui propose des sous-listes de synonymes, accompagnées de sélecteurs sémantiques, cooccurrentiels ou syntaxiques qui faciliteraient l’identification (semi-)automatique des synonymes valides pour l’emploi particulier de chacun des mots-occurrences. Nous nous tournons donc vers des dictionnaires de synonymie distinctive.

3. Comparaison du potentiel informationnel de trois dictionnaires de synonymie distinctive

23Les principaux éditeurs de dictionnaires du marché français – Le Robert, Larousse et Hachette Éducation – offrent trois dictionnaires de synonymes qui ont chacun une manière différente d’introduire les sous-ensembles de synonymes des items en adresse d’articles.

3.1 Présentation des dictionnaires comparés

  • 24  Nous conservons cette référence, mais une nouvelle édition du Dictionnaire des synonymes, nuances (...)
  • 25  L’article descendre du Dsn-Dico-Robert est consultable à l’URL suivante (onglet « Synonymes ») : h (...)

24Le Dictionnaire des synonymes et nuances du Robert (2020)24, tel que ses synonymes sont repris dans l’onglet « Synonymes » du Dico en ligne (ci-après : Dsn-Dico-Robert)25, distingue les sous-ensembles par la position initiale et la valorisation typographique (mis en gras) du synonyme le plus représentatif du sens partagé par les items de chaque sous-ensemble. Selon l’éditeur, c’est le moyen le plus rapide et le plus efficace de « rappeler un mot ou une expression que l’on connaît mais qui fait défaut au moment où l’on rédige » (volume imprimé, « Préface », p. V [non numérotée], § « Un nouveau concept de dictionnaire de synonymes », paragraphe 2). Les articles fournissent uniquement des mots de sens équivalent ou très voisin, mais les éditeurs invitent à « circuler dans le dictionnaire et [à] élargir ainsi son choix de synonymes » (p. VII, § « Les synonymes », paragraphe 3). Dans le volume imprimé, 200 000 synonymes sont proposés pour 25 000 mots et expressions et 1 400 mots proches sont comparés. L’accueil du Dico en ligne (« Bienvenue sur le site de référence de la langue française ! ») indique seulement « 200 000 synonymes organisés par sens ».

25Le Grand dictionnaire Synonymes & Contraires de Larousse (2004), tel qu’il est consultable en ligne sur le site Fr.TheFreeDictionary (ci-après : GdSC-FreeDic-Larousse)26, est présenté, dans le volume imprimé source, comme étant « [u]n dictionnaire pratique, dans sa consultation et dans la circulation entre les mots » (« Avant-propos », p. II [non-numérotée], § « Quels ont été nos choix ? », paragraphe 2 ). Il propose, lui aussi, 200 000 synonymes (pour un nombre d’entrées non précisé). Ce dictionnaire conduit « le lecteur au mot qu’il recherche par des définitions concises, systématiques et précises » (Idem, paragraphe 5), permettant de savoir pour quelle acception de l’entrée un ensemble de synonymes est pertinent.

26Enfin, le Dictionnaire des synonymes d’Hachette Éducation (Baratin et Baratin-Lorenzi, 1996), qui n’est pas disponible en ligne mais qui l’est sur le CD-ROM du Dictionnaires français Hachette édité en 2001 (ci-après : Ds-DfH-Hachette) présente chaque sous-ensemble introduit par une contextualisation de l’item en adresse qui en discrimine l’emploi syntaxico-sémantique. Ce dictionnaire est un peu moins fourni que les deux précédents (120 000 synonymes pour 18 000 entrées, selon la 4e de couverture du volume imprimé de 1996). Son « Avant-propos » (non signé) indique qu’il vise à fournir « un terme qui puisse permuter avec celui qu’on a en tête, dans la même tournure et, bien sûr, sans changement de sens » (p. VII, paragraphe 7).

27Les traitements du verbe descendre que ces trois dictionnaires proposent diffèrent fortement (Tableau 3).

  • 27  Les codifications typographiques de cet affichage sont surprenantes : outre le fait que les mises (...)
  • 28  La présence de « : » après la marque affectée à un synonyme montre bien que la marque est antéposé (...)

Dsn-Dico-Robert27

GdSC-FreeDic-Larousse28

Ds-DfH-Hachette

Tableau 3. Articles descendre des trois dictionnaires de synonymie distinctive pris en compte

3.2 Évaluation de la pertinence des sélecteurs de listes de synonymes pour des couples de mots

28Pour comparer les capacités des trois dictionnaires à révéler les relations synonymiques valides pour les mots-occurrences de notre corpus, observons concrètement le couple de traductions de Virgile déjà présenté (A.) et voyons si les synonymes saillants, les définitions ou les contextualisations sont exploitables (et, de surcroît, peuvent l’être informatiquement) pour valider le repérage d’un synonyme dans l’ensemble qu’ils introduisent. Pour ce faire, nous considérons plusieurs segments, en consultant les articles des items attestés dans la traduction de Ch. Héquin de Guerle 1827 (donnée en premier ci-après) afin d’y chercher les items synonymes attestés dans la réécriture de D. Nisard (éd.) 1868 (donnée en second).

29Pour les segments « ses forêts noires d’épouvante » vs « ses bois que remplissent l’horreur et les ténèbres » :

30L’entrée forêt ne figure pas dans le GdSC-FreeDic-Larousse, mais, dans le Dsn-Dico-Robert, bois est son synonyme principal et, dans le Ds-DfH-Hachette, c’est l’unique équivalent fourni (C.).

A. s.v. forêt

a) Dsn-Dico-Robert : 1er • « bois, futaie, plantation »

b) GdSC-FreeDic-Larousse : Ø

c) Ds-DfH-Hachette : « 1. (Se promener dans une forêt) ▷ bois. »

  • 29  La question d’un test de validité informatisé, quant à elle, n’est pas abordée à ce stade de notre (...)

31Les trois dictionnaires permettent d’apparier sans obstacles épouvante avec horreur puisque s.v. épouvante le nom horreur est effectivement attesté dans une liste qui s’avère introduite par un sélecteur de sens que, en tant que lecteurs, nous pouvons considérer comme valide29 (D.).

  • 30  Les articles épouvante comportent chacun une seule liste, donc :

A. s.v. épouvante30

a) Dsn-Dico-Robert : « terreur, affolement, effroi, frayeur, horreur, panique, épouvantement (vieux) »

b) GdSC-FreeDic-Larousse : « Sentiment de peur intense  affolement, angoisse, crainte, effroi, frayeur, horreur, panique, terreur. »

c) Ds-DfH-Hachette : « (Des attentats qui sèment l’épouvante) ▷ affolement, effroi, horreur, panique, peur, terreur. »

32Pour les segments « les Mânes et leur formidable roi » vs « les mânes et le terrible roi des enfers », l’appariement de formidable et de terrible est également possible en exploitant les trois dictionnaires (E.), mais le contrôle de pertinence échoue puisque le sens traité n’est pas le même dans le Dsn-Dico-Robert (où il signifie « effrayant », comme dans le corpus), que dans le GdSC-FreeDic-Larousse (où il est défini par « qui sort de l’ordinaire ») et le Ds-DfH-Hachette qui contextualise le même emploi (« Une soirée formidable »). Par ailleurs, les dictionnaires indiquent que terrible, avec ce sens, relève d’un emploi familier, alors que nous n’observons pas de changement de registre au sein des phrases traitées.

A. s.v. formidable

a) Dsn-Dico-Robert : 4e • « effrayant, épouvantable, redoutable, terrible (familier) »

b) GdSC-FreeDic-Larousse : « 1. Qui sort de l’ordinaire  effrayant, étonnant, étourdissant, extraordinaire, fantastique, gigantesque, imposant, inouï, magnifique, prodigieux, stupéfiant -familier: énorme, époustouflant, faramineux, renversant, terrible. »

c) Ds-DfH-Hachette : « 2. Fam. (Une soirée formidable) ▷ dément (fam.), du tonnerre (fam.), épatant (fam.), extraordinaire, fabuleux (fam.), fantastique, géant (fam.), génial (fam.), merveilleux, prodigieux, sensationnel, super (fam.), terrible (fam.). »

33Pour les segments « ces cœurs impitoyables que des prières humaines n’ont jamais fléchis » vs « ces cœurs que les prières des humains n’ont jamais attendris », et spécifiquement le couple fléchir et attendrir (F.), le Dsn-Dico-Robert et le GdSC-FreeDic-Larousse proposent de différencier les emplois transitif et intransitif de fléchir, ce qui est pertinent pour ce verbe afin de limiter le nombre des synonymes à prendre en compte. Le Ds-DfH-Hachette ne caractérise pas la construction de la contextualisation, mais elle est transitive.

A. s.v. fléchir

a) Dsn-Dico-Robert : verbe transitif, 1er • « émouvoir, apitoyer, adoucir, attendrir, désarmer, ébranler, faire céder, gagner, toucher, se concilier, gagner à sa cause »

b) GdSC-FreeDic-Larousse : verbe transitif « 2. Faire céder quelqu’un  adoucir, apitoyer, attendrir, désarmer, ébranler, toucher. »

c) Ds-DfH-Hachette : « 3. Fig. (Fléchir qqn à force de prières)  apitoyer, attendrir, désarmer, ébranler, émouvoir, faire céder, toucher. »

34La contextualisation du Ds-DfH-Hachette contient en outre le cooccurrent prière, attesté dans les deux phrases du corpus, ce qui nous permet de confirmer la mise en relation des synonymes. Le Dsn-Dico-Robert ne propose pas de cooccurrents des synonymes listés, sauf au sein de l’expression « gagner à sa cause » qui est lexicalisée, et le GdSC-FreeDic-Larousse propose une définition (« Faire céder quelqu’un ») qui n’est pas informatiquement exploitable dans ce contexte puisqu’elle ne contient pas d’indice tel que la présence du cooccurrent prière.

3.3 Combiner traits sémantiques, rections et cooccurrences privilégiées : le cas des occurrences de descendre

35Alors que la transitivité peut être un des indices formels facilitant le choix des synonymes, comme pour fléchir dans le contexte précédent, les 67 % d’occurrences de descendre (160/239) qui expriment, pour un sujet animé, le fait de <se déplacer vers le bas> peuvent se combiner avec des compléments de lieu ou des COD exprimant un lieu : « Il osa même descendre dans les gouffres du Ténare », « Orphée descend vers le Styx », « Il descend la montagne », etc. Les emplois sont donc intransitifs ou transitifs, mais souvent avec une localisation mentionnée : N[+animé] V[+mouvement +vers le bas] Prép? N[+lieu].

36Les entrées de descendre dans les trois dictionnaires (Tableau 3) permettent de voir qu’ils ne prennent pas en compte la rection de manière identique : elle est explicite dans les dictionnaires du Robert et de Larousse, mais celui de Larousse s’en tient à l’opposition intransitif / transitif alors que celui du Robert isole en plus, à la fin du traitement des emplois intransitifs, ceux des constructions descendre de et descendre jusqu’à (cf. n. 27).

37Bizarrement, le Ds-DfH-Hachette ne traite pas le verbe descendre en tant que verbe de mouvement vers le bas réalisé par son sujet (Tableau 3 et G.c.). Dans le Dsn-Dico-Robert (G.a.) et le GdSC-FreeDic-Larousse (G.b.), nous trouvons, comme synonyme du verbe transitif descendre, le verbe dévaler, que nous avons vu être le plus souvent apparié à descendre lors de notre expérimentation d’appariement synonymique avec le DES (§ 2).

A. s.v. descendre

a) Dsn-Dico-Robert : verbe transitif, 1er • « dégringoler, dévaler »

b) GdSC-FreeDic-Larousse : verbe transitif « 2. Parcourir de haut en bas  dévaler -familier: débouler, dégringoler. » ; verbe intransitif « 1. Aller de haut en bas ≡ décliner, rétrograder -familier: dégringoler. »

c) Ds-DfH-Hachette : Ø

38Dans le corpus, dévaler apparaît 14 fois, majoritairement dans des emplois associés à des mentions de lieu et avec un sujet animé : « il me faut dévaller au Platonique monde », « sans frayeur [il] dévala en ceux lieux », « je n’y veux devaller par sanglantes alarmes », « il s’élance à travers les fourrés et les roches pour dévaler l’autre versant », « l’ombre d’Orphée devala dans les Enfers », « sans long intervalle au pays Thracien il devalle », « cet Amant fidelle osa […] devaler en des lieux ou n’arriva jamais la lumière des Cieux », « en enfer est sans demorance l’ame dou devin devalee », « Suis-je si malheureux de t’avoir espousée pour devaller si tost dans la plaine Élysée ? », « je veux pour te revoir devaller aux Enfers », « voulor devaller dans la pasle demeure », « pour finir mes travaux je veux y devaller », « chez Pluton devaller pour vous mettre en repos », « Je ne suis devalé dedans ce creux Tartare ».

39Un autre synonyme, dégringoler, également listé dans le DES (Figure 2) et fourni par le Dsn-Dico-Robert, s.v. descendre verbe transitif 1 (G.a.), figure dans le GdSC-FreeDic-Larousse pour les deux rections. Dans le corpus, il correspond à la même idée de mouvement vers le bas et un N[+lieu] de destination est toujours mentionné, que le sujet soit animé ou non : « Notre amant se met en chemin / Et dans l’Empire souterrain / Il dégringole en moins de rien » (Grandval, 1729), « [Q]uelque chose gronda. Cela évoqua pour lui des rochers d’abord vacillant puis dégringolant au fond d’une gorge » (Jimenes, 2004).

40Les autres synonymes du sous-ensemble intransitif du GdSC-FreeDic-Larousse (G.b.), décliner et rétrograder, n’expriment pas le déplacement physique d’une entité animée. Le corpus le confirme :

– 5 occurrences sur 6 de décliner sont intransitives et employées avec un sujet non animé soleil ou jour : « Le jour décline », « Le soleil, moins ardent et plus large, décline », « Le soleil décline », « le soleil pâli décline et se consume », « le soleil déclinait, allongeant les ombres » ;

– 1, transitive, exprime un refus formulé par un sujet animé : « Orphée déclina son offre » ;

– parmi les 4 occurrences de rétrograder, aucune ne mentionne de lieu physique, puisqu’elles expriment le retour à un état antérieur : « sa pensée […] rétrogradait vers les temps où les rois étaient des dieux », « Parviendrons-nous à […] rétrograder lorsque l’épreuve aura été au-dessus des forces de l’adepte ? », « Le Grec qui n’avait pas cru aux mystères d’Éleusis était condamné à rétrograder », « Ceux qui sont nés dans le christianisme […] ne seront-ils pas condamnés à rétrograder vers l’état antérieur ? ».

41La définition « Aller de haut en bas » du GdSC-FreeDic-Larousse laisse donc ouvert le choix du trait plus ou moins animé de l’entité qui se déplace et du lieu concret ou abstrait de déplacement.

  • 31  Cette liste unique du Dico en ligne est subdivisée en 3 singletons (dont le synonyme du premier es (...)

42Dans le Dsn-Dico-Robert, décliner n’apparaît dans aucune des listes et rétrograder introduit un sous-ensemble de synonymes du verbe intransitif (3e • « rétrograder, baisser, être relégué ») qui n’expriment pas de déplacement physique vers le bas. Le sous-ensemble le plus proche du sens de décliner (2e • « [astre] se coucher, [nuit] tomber, [mer] se retirer »), s.v. descendre verbe intransitif toujours, propose des synonymes dont les sujets sont sélectionnés par des cooccurrents typiques astre, nuit et mer afin de réunir des verbes de sens légèrement différent31. Un de ces cooccurrents, nuit, est effectivement attesté dans notre corpus comme sujet de tomber (Tableau 4).

Construction

Verbes et expressions

Exemple d’occurrence

V[+ mouvement +vers le bas]

tomber (10 occ.)

« la nuit tombe »

descendre (3 occ.)

« la nuit descendit sur la terre »

V[+/- mouvement -vers le bas]

venir (10 occ.)

« [la] nuit bénie qui vient verser sur nous sa douceur infinie »

s’étendre (2 occ.)

« la nuit anticipée s’étendit sur les eaux »

s’avancer (2 occ.)

« la nuit transparente s’avançait en silence »

se faire (2 occ.)

« la nuit se fait »

approcher (1 occ.)

« la nuit approche »

arriver (1 occ.)

« la nuit arrive subitement »

régner (1 occ.)

« la nuit règne »

Expressions verbales[-mouvement
-vers le bas]

épaissir l’air (1 occ.)

« Quant la nuit comme une grande fumée épaissit l’air »

envelopper quelqu’un (1 occ.)

« L’éternelle nuit m’enveloppe »

couvrir de son manteau (1 occ.)

« la nuit couvre de son manteau la surface de la terre »

Tableau 4. Résultats d’interrogation du corpus pour nuit[sujet] V

43Même si, sur les 35 occurrences de la construction nuit[sujet] V, 13 seulement comportent des verbes exprimant un déplacement vers le bas (10 occurrences de tomber et 3 de descendre), toutes expriment la transition du jour à la nuit. La présence du sujet nuit conditionne donc très fortement, dans notre corpus, les interprétations verbales, sans qu’il soit utile de prendre en compte des indications de lieu éventuellement présentes.

3.4 Observations conclusives

44Alors que nous devons rapidement renoncer à exploiter le Ds-DfH-Hachette, qui sélectionne les emplois de manière trop particularisante avec des contextualisations et dont le traitement de la polysémie semble être moins exhaustif, les contenus du Dsn-Dico-Robert et du GdSC-FreeDic-Larousse sont assez complémentaires. Toutefois, en ce qui concerne la structure des articles, le Dsn-Dico-Robert est susceptible d’être plus facilement exploitable informatiquement. Il propose :

– des cooccurrents entre crochets qui sélectionnent la valeur sémantique de l’item traité : s.v. descendre, verbe intransitif, 2e • « [nuit] tomber » ;

– les prépositions introductrices des compléments : s.v. descendre, verbe intransitif « descendre de venir de, émaner de, être issu de, provenir de » ;

– des constructions lemmatisées : s.v. passer, verbe intransitif « passer de… à • se couler, se glisser [• …] » ;

  • 32  Un curieux double traitement de descente aux enfers s’observe dans l’article descente du Dico en l (...)

– des expressions : s.v. descente « descente aux enfers chute, dégringolade, disgrâce32 » ;

– des marquages (diachroniques, diatopiques, etc.) assignés spécifiquement à chaque synonyme auquel la marque est postposée ou à l’item en adresse quand la marque précède la liste : « rejeton (vieux ou plaisant) », s.v. descendant, ou, pour une valeur de descendre non attestée dans notre corpus « [familier] tuer, buter (familier), flinguer (familier), dessouder (argot) », s.v. descendre verbe transitif, 7e •. La première marque (entre crochets) concerne descendre et les suivantes (entre parenthèses) le synonyme qui précède chaque marque.

45Par ailleurs, les différentes constructions des verbes sont traitées au sein de subdivisions du même article, alors que le GdSC-FreeDic-Larousse les dégroupe.

  • 33  Les lexicographes évitent ainsi des multiplier les divisions d’articles afin de n’en créer que pou (...)

46Enfin, même si l’introduction des sous-ensembles par le synonyme le plus saillant n’apporte pas d’indices supplémentaires pour déterminer si le sens de l’occurrence en corpus est proche de celui pour lequel les synonymes sont valides, cet item est plus facilement exploitable que les définitions proposées par le GdSC-FreeDic-Larousse. En effet, celles-ci sont trop hétérogènes dans leurs formulations pour pouvoir y localiser et en extraire automatiquement des informations-clés et elles sont parfois volontairement implicites afin de permettre de regrouper des synonymes d’occurrences de l’item en adresse présentant des sens voisins mais distinguables33, comme « Aller de haut en bas » (§ 3.c.) qui peut correspondre à une glose d’occurrences verbales acceptant des sujets +/- animés et des déplacements entre des lieux concrets ou des éléments abstraits (dont des états).

4. Vers une nouvelle méthode d’appariement appuyée sur de la synonymie distinctive et les cooccurrences privilégiées ?

47Le Dsn-Dico-Robert paraît être le mieux adapté à nos besoins. Mais pour exploiter pleinement son potentiel, il est nécessaire d’adapter le traitement élaboré pour le DES, notamment afin d’améliorer la prise en compte du contexte de chaque occurrence et l’identification du sens d’un mot-occurrence polysémique. En effet, nous vérifions sans surprise que la présence de certains cooccurrents sujets ou au sein des mentions de localisations joue un rôle important dans la discrimination des emplois du verbe descendre du corpus.

4.1 Dictionnaires de cooccurrences d’Antidote et du Robert correcteur

  • 34  Ils proposent aussi des dictionnaires de synonymes. Celui d’Antidote est de facture classique, alo (...)

48Pour affiner la sélection des synonymes pertinents, nous aimerions donc mieux exploiter ces cooccurrents. De nouveau, nous nous tournons vers des ressources dictionnairiques afin d’évaluer ce qu’elles peuvent apporter à notre traitement. Les logiciels de correction orthographique, grammaticale et typographique, Antidote et le Robert correcteur, proposent des dictionnaires de cooccurrences34, qui semblent répondre à notre besoin et dont nous cherchons aussi à apprécier s’ils peuvent constituer un type de ressources complémentaires des dictionnaires de synonymes. Les inventaires de cooccurrents proposés dans ces deux dictionnaires sont classés par sens de l’item traité et indiquent les relations syntaxiques entre l’item et son cooccurrent.

  • 35  Dans le Robert correcteur, nous trouvons seulement « descendre le fleuve » s.v. descendre « Sens 1 (...)

49Dans la phrase de la traduction de Nisard des Métamorphoses (1869) présentée en H., deux éléments du contexte peuvent être directement trouvés dans le dictionnaire de cooccurrences d’Antidote (mais pas dans l’onglet « Combinaisons » du Robert correcteur), « par la porte » et « oser » et un troisième peut l’être indirectement, puisque si « vers le Styx » est trop spécifique pour figurer parmi les cooccurrents, nous y trouvons une expression de même construction avec un hyperonyme (« vers le fleuve »35).

A. Ovide, Métamorphoses : D. Nisard (éd.), 1869 vs le dictionnaire de cooccurrences d’Antidote (mot vedette des articles consultés, cooccurrents des articles, cooccurrent hyponyme de l’un de ceux des articles) :

a) « Quand le chantre du Rhodope l’eut assez pleurée à la face du ciel, résolu de tout affronter, même les ombres, il osa descendre vers le Styxvers le fleuve par la porte du Ténare, à travers ces peuples légers, fantômes honorés des tributs funèbres ; il aborda Perséphone et le maître de ces demeures désolées, le souverain des mânes. »

50Ces 3 cooccurrents ne sont listés que pour le sens « Aller vers le bas » s.v. descendre, qu’ils permettent donc de retenir automatiquement comme interprétation valide dans ce contexte. Ce constat fait, il reste toujours le problème de l’articulation avec le dictionnaire des synonymes. Or, alors qu’un lien peut être fait avec la définition « Aller de haut en bas » de GdSC-FreeDic-Larousse (2 mots communs, aller et bas), ce n’est pas le cas pour le Dsn-Dico-Robert dans lequel les sous-ensembles ne sont pas introduits par des définitions. Plus encore, nous constatons que l’articulation n’est pas non plus possible avec le dictionnaire des synonymes d’Antidote lui-même (cf. n. 34), qui regroupe des structures assez hétérogènes (Tableau 5), en fonction des articles : s.v. descendre, les sous-ensembles sont introduits, comme dans le Dsn-Dico-Robert, par le synonyme le plus représentatif, mais s.v. dégringoler, par exemple, nous trouvons des définitions, comme dans le GdSC-FreeDic-Larousse.

Tableau 5. Articles descendre et dégringoler de l’onglet « Synonymes » d’Antidote

4.2 Améliorer la prise en compte du contexte : visualisation en graphes

  • 36  Voir également (Chardon, 2020) qui expose les différentes méthodes de calcul et de visualisation d (...)

51Nous butons sur les procédures qui permettraient d’exploiter les combinaisons de mots des dictionnaires spécialisés (d’Antidote, du Robert correcteur ou, maintenant, du Dsn-Dico-Robert et du Grand Robert) confrontés aux cooccurrents de nos mots occurrences afin d’en déterminer le sens, mais nous pouvons au moins nous inspirer de leur principe de regroupement des cooccurrents fournis par valeurs sémantiques de l’item traité. Celui du Robert correcteur est particulièrement intéressant, car les cooccurrents de chaque emploi d’un item y sont présentés au moyen de graphes36. Cette approche s’avère transposable à notre recherche, comme nous le constatons en explorant un sous-corpus constitué des seules traductions de Virgile et d’Ovide en repérant les contextes de chacune dans lesquels une occurrence de descendre est associée à un sujet N[+animé] et au nom de lieu Enfers ainsi que les contextes correspondants dans les autres traductions, dont les auteurs ont préféré un autre verbe ou une expression verbale à descendre. Nous constatons qu’en fonction du sujet, les équivalents de descendre dans les traductions qui choisissent un autre verbe ne sont pas les mêmes. Pour le sujet Orphée, nous trouvons des verbes comme se précipiter, pénétrer ou venir dont le sens implique un mouvement volontaire. Pour le sujet Eurydice, ou les noms communs morts et mortels (au pluriel pour nommer l’ensemble de ceux qui sont morts ou mortels), l’action n’est pas volontaire (tomber, chuter, être précipité, etc.).

52Bien que nous ne puissions pas détailler dans l’espace de cette contribution l’ébauche de traitement informatique conçu afin qu’il exploite les cooccurrents pour sélectionner les ensembles de synonymes, les premiers résultats obtenus sont encourageants. L’ensemble des verbes du corpus qui prennent Orphée comme sujet et mentionnent Enfers dans un complément nous permet déjà, avec une exploitation hypertextuelle du Dsn-Dico-Robert, d’aboutir à un graphe des relations synonymiques des verbes du corpus pour cette sélection de contextes (Figure 3). En son sein, tous les verbes attestés dans le corpus sont liés en fonction de leur mention dans les articles du dictionnaire (comme item en adresse ou comme synonyme d’une des listes), tantôt directement et réciproquement, comme descendre et dévaler, présents chacun dans l’article de l’autre (b. et c.), tantôt indirectement, comme descendre et se glisser (e.), pour lequel plusieurs cheminements dans le graphe sont possibles, mais l’un d’eux consiste à observer que descendre dans est un synonyme de plonger (g.), qui est lui-même synonyme de pénétrer (f.), lui-même synonyme de se glisser (e.).

Figure 3. Visualisation en graphe et en listes de synonymes pertinents extraits de l’article descendre et de ceux de ses correspondants dans le corpus (items représentés dans le graphe et soulignés dans les listes extraites des articles du Dsn-Dico-Robert)

53Les relations au sein de ce graphe sont assez complexes : tous les composants sont liés au moins à 2 autres nœuds, sauf dévaler et se précipiter, qui étaient synonymes dans le GdSC-FreeDic-Larousse, mais qui ne sont pas inventoriés dans leurs listes respectives (c. et h.) au sein du Dsn-Dico-Robert, et qui ne sont pas dans plus d’une liste de synonymes ou en adresse des articles mobilisés du Dsn-Dico-Robert (s.v. descendre et dans son article propre pour dévaler (b. et c.), et dans son article pour se précipiter (h.)). Notons aussi qu’entrer occupe une position importante, car il est lié à 5 nœuds différents : son article (d.) liste aller et venir, et il figure dans les listes des articles pénétrer (f.), plonger (g.) et (se) glisser (e.).

  • 37 La proximité se calcule à partir du nombre d’arcs qu’il faut parcourir pour arriver d’un nœud à l’a (...)
  • 38 Entrer est considéré comme étant au centre du graphe non seulement parce qu’il est lié à plusieurs (...)
  • 39  L’annotation du corpus pourrait à la rigueur s’envisager sans étape de validation de la pertinence (...)

54Cette méthode permet d’exploiter pleinement le caractère distinctif du Dsn-Dico-Robert et d’automatiser l’appariement d’une sélection pertinente de synonymes pour chaque mot-clé attesté dans le sous-corpus des traductions. Plus encore, la proximité des appariements ainsi établis peut être graduée, grâce, entre autres, à des calculs issus de la théorie des réseaux, comme la proximité37 ou la centralité38. Enfin, la liste des équivalents attestés dans le sous-corpus peut être étoffée par les autres synonymes des sous-ensembles sélectionnés39, ce qui nous arme mieux pour annoter avec leurs synonymes les mots-occurrences de l’ensemble du corpus qui peuvent en recevoir, en espérant que ceci permette, en fin de traitement, de trouver des énoncés non encore appariés que les synonymes de leurs annotations permettraient de lier.

5. Conclusion et perspectives

55Après avoir constaté quelques difficultés d’exploitation d’une ressource de synonymie cumulative dans le cadre de notre projet, nous avons comparé trois dictionnaires de synonymie distinctive, le Dsn-Dico-Robert, le GdSC-FreeDic-Larousse et le Ds-DfH-Hachette, pour juger de leur capacité à révéler les relations synonymiques présentes dans notre corpus. C’est finalement le Dsn-Dico-Robert qui apparaît comme le mieux exploitable pour nos besoins, à condition de concevoir une méthode d’appariement (semi-)automatique capable de prendre en compte les cooccurrents les mieux repérés de chaque mot à apparier et d’exploiter les équivalents déjà attestés dans le corpus.

  • 40  Les résultats d’une expérimentation avec word2vec sont plutôt décevants, puisque parmi les verbes (...)

56Alors que l’expérimentation que nous avons menée sur le verbe descendre, polysémique et très fréquent dans notre corpus, montre que la méthode que nous proposons est probante, son déploiement à la totalité du corpus reste difficile. Les ressources dont nous avons besoin, comme les dictionnaires de synonymie distinctive et de cooccurrences, appartiennent à des acteurs commerciaux et ne sont donc pas exploitables pour des traitements automatiques (sauf accord à obtenir auprès des éditeurs, alors qu’ils n’ont a priori pas d’enjeux à participer à des projets de recherche non financés). Les ressources linguistiques disponibles librement en format numérique sont des ressources de synonymie cumulative. Les représentations distributionnelles, comme les plongements lexicaux, même si elles gagnent en popularité s’appliquent, pour le moment, difficilement aux petits corpus comme le nôtre.40

  • 41  Certains dictionnaires proposent des attestations, au sein de corpus variés, de l’item en adresse (...)

57Selon nous, les ressources lexicographiques existantes ont un réel potentiel d’exploitation dans les projets d’humanités numériques, comme le nôtre, comme pour certaines tâches de traitement automatique des langues naturelles. En exploitant les traitements mis en œuvre dans une sélection choisie de dictionnaires imprimés et numériques de facture traditionnelle – dictionnaires de synonymie distinctive et de cooccurrences –, nous constatons l’amélioration significative de la pertinence de l’appariement (semi-)automatique des synonymes présents dans notre corpus. Même si elle poserait la question des droits de consultation par un automate et celle de la couverture des nomenclatures et des inventaires synonymiques offerts à la consultation, la possibilité d’exploiter effectivement ces ressources à grande échelle ouvrirait sans doute de nouvelles perspectives probantes. Elle serait en outre susceptible de profiter en retour aux lexicographes, dans le cadre d’accords de recherche et développement, puisque, par exemple, ils pourraient ainsi proposer, en marge des articles de leurs dictionnaires de synonymes, des attestations, au sein de corpus d’œuvres littéraires, d’emplois de certaines paires d’équivalents (un peu comme dans notre Tableau 1, colonnes 2 et 3)41, chaque paire de synonymes en contextes comparables ayant été validée dans le cadre d’une annotation de corpus intégrant des synonymes par des analystes littéraires engagés dans des projets éditoriaux numériques.

Haut de page

Bibliographie

Antidote 10 (français). (2021). Version 6.3, Montréal (Québec) : Druide Informatique Inc. URL : https://www.antidote.info/fr.

Baratin, M. et Baratin-Lorenzi, M. (1996). Dictionnaire des synonymes, Paris : Hachette Éducation.

Bergroth, L., Hakonen, H. et Raita, T. (2000). « A Survey of Longest Common Subsequence Algorithms ». In : Proceedings of the Seventh International Symposium on String Processing Information Retrieval. Corogne, p. 39-48. DOI : 10.1109/SPIRE.2000.878178.

Büchler, M. (2013). Informationstechnische Aspekte des Historical Text Re-use. Thèse de doctorat en informatique soutenue le 19 mars 2013. Faculté de Mathématiques et d'Informatique de l'Université de Leipzig. URL : https://ul.qucosa.de/api/qucosa%3A11877/attachment/ATT-0/.

Chardon, L. (2020). « L’espace sémantique du Dictionnaire électronique des synonymes (DES) et les méthodes de regroupement de sens : l’exemple de sec ». In : Syntaxe & Sémantique, no 21, p. 87-126.

Chardon, L. et François, J. (2020). « Les vedettes du Dictionnaire Électronique des Synonymes et les relations d’adjacence entre leurs synonymes ». In : Lexique, no 27, p. 21-45.

Dictionnaire des combinaisons de mots. 2007. Paris : Le Robert. – éd. la plus récente. 2020.

Dico en ligne [en ligne]. Paris : Le Robert. Consulté le 30/08/2022. URL : https://dictionnaire.lerobert.com/.

Dictionnaire des synonymes et nuances. (2020). Paris : Le Robert.

Dictionnaire des synonymes, nuances et contraires. (2022). Paris : Le Robert.

Dictionnaire électronique des synonymes [en ligne]. (2022). Caen : Crisco, Université de Caen Normandie. Consulté le 30/08/2022. URL : https://crisco.unicaen.fr/glossaire/des/.

Dictionnaires français Hachette [CD-ROM Windows]. (2001). Paris : Hachette Multimédia / Hachette Livre.

Ds-DfH-Hachette : voir Dictionnaires français Hachette.

Dsn-Dico-Robert : voir Dico en ligne.

Fr.TheFreeDictionary (français) [en ligne]. Huntingdon Valley (Pennsylvanie) : Farlex. Consulté le 30/08/2022. URL : https://fr.thefreedictionary.com/.

GdSC-FreeDic-Larousse : voir Fr.TheFreeDictionary.

Grand dictionnaire Synonymes & Contraires. (2004). Paris : Larousse.

Grand Robert de la langue française (Le) [en ligne sur abonnement]. Mise à jour la plus récente : février 2022. Paris : Le Robert. Consulté le 30/08/2022. URL : https://grandrobert.lerobert.com/robert.asp.

Grandval, N. R. (1729). Orphée. Cantate avec simphonie. Paris : Boivin, Le Clerc. URL : https://0-gallica-bnf-fr.catalogue.libraries.london.ac.uk/ark:/12148/bpt6k4500405f.

Horton, R., Olsen, M. et Roe, G. (2010). « Something Borrowed: Sequence Alignment and the Identification of Similar Passages in Large Text Collections ». In : Digital Studies / Le Champ numérique, no 2 (1). DOI : 10.16995/DSCN.258.

Jimenes, G. (2004). Orphée l’enchanteur. Paris : Nathan. Éd. brochée et EPUB2, cf. https://site.nathan.fr/livres/orphee-lenchanteur-9782092547151.html (consulté le 31/07/2023).

Mikolov, T. et al. (2013). Efficient Estimation of Word Representations in Vector Space. In : arXiv. DOI : 10.48550/arXiv.1301.3781.

Ovide (1806). Les Métamorphoses d’Ovide, traduction nouvelle, avec le texte latin. M.-G.-T. Villenave (trad.). Paris : F. Gay, Ch. Guestard. URL : https://0-gallica-bnf-fr.catalogue.libraries.london.ac.uk/ark:/12148/bpt6k1525155s/.

Ovide (1869). « Métamorphoses », In D. Nisard (éd.), L. Puget et T. Guiard (trads.) Œuvres complètes : avec la traduction en français. Paris : Firmin Didot Frères, pp. 418–420. URL : https://0-gallica-bnf-fr.catalogue.libraries.london.ac.uk/ark:/12148/bpt6k282076j.

Petit Robert. Dictionnaire alphabétique et analogique de la langue française (Le) [en ligne sur abonnement]. Mise à jour la plus récente : 2022. Paris : Le Robert. Consulté le 30/08/2022. URL : https://petitrobert.lerobert.com/robert.asp.

Robert correcteur. (2022). Version 3.5.6. Paris / Sophia Antipolis : Le Robert / Éditions Diagonal. URL : https://www.lerobert.com/correcteur/francais.

Sagot, B. (2017). « Représentation de l’information sémantique lexicale : le modèle wordnet et son application au français ». In : Revue Française de Linguistique Appliquée. Paris : Publications linguistiques, 2017, XXII. HAL: hal-01583995.

Schmidt, H. (1994). « Probabilistic part-of-speech tagging using decision trees ». In : Proceedings of International Conference on New Methods in Language Processing. Manchester. URL : https://www.cis.lmu.de/~schmid/tools/TreeTagger/data/tree-tagger1.pdf.

Suchecka, K. et Gasiglia, N. (2021a). « Réécritures d’un mythe et outils de détection des réutilisations. De l’Orphée de Virgile à celui de Ballanche ». In : Humanités numériques, no 2021|4. DOI : 10.4000/revuehn.2467.

Suchecka, K. et Gasiglia, N. (2021b). « On Digital Comparative Editions and Textual Similarity Detection Tools: Towards a Hypertextual Cartography of a Rewritten Myth ». In : P. Plecháč et al. (éds) Tackling the Toolkit: Plotting Poetry through Computational Literary Studies. Institute of Czech Literature of the Czech Academy of Sciences, p. 167-182. DOI : 10.51305/ICL.CZ.9788076580336.11.

Suchecka, K. et Gasiglia, N. (2022). « TAL et Littérature comparée. Détection automatique des correspondances textuelles entre les réécritures d’un mythe ». In : Y. Estève, T. Jiménez, T. Parcollet, M. Zanon Boito (éds.), Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Avignon, France, 27 juin au 1er juillet 2022. Atelier TAL et Humanités Numériques (TAL-HN), p. 88-98. URL : https://aclanthology.org/2022.jeptalnrecital-humanum.10.

Suchecka, K. et Gasiglia, N. (à paraître). « Édition comparative numérique des réécritures du mythe d’Orphée et Eurydice. Cartographie hypertextuelle des correspondances ». In : P. Mougin (éd.) Design et littérature. Dijon : Les presses du réel, p. 215-237.

Virgile. (1827). Les bucoliques et les géorgiques de Virgile, traductions nouvelles. C. Héguin de Guerle (trad.). Paris : Auguste Delalain. URL : https://numelyo.bm-lyon.fr/f_view/BML:BML_00GOO0100137001100373435.

Virgile. (1868). « Géorgiques ». In : D. Nisard (éd. & trad.), Lucrèce, Virgile, Valérius Flaccus : œuvres complètes, avec la traduction en français. Paris : Firmin Didot Frères, p. 225-227. URL : https://0-gallica-bnf-fr.catalogue.libraries.london.ac.uk/ark:/12148/bpt6k2820755/.

Wise, M.J. (1995). « Neweyes: A System for Comparing Biological Sequences Using the Running Karp-Rabin Greedy String-Tiling Algorithm ». In : ISMB-95 Proceedings. AAAI, p. 393-401. URL : https://pubmed.ncbi.nlm.nih.gov/7584464/.

Haut de page

Notes

1  Schématiquement : aides à la compréhension, à l’expression ou à l’amélioration de la compétence métalinguistique apportées à des utilisateurs humains.

2  WordNet Libre du Français, Inria, ANR EDyLex, cf. http://pauillac.inria.fr/~sagot/index.html#wolf et (Sagot, 2017).

3  Par exemple avec l’algorithme Word2vec développé par le groupe de recherche de Google (Mikolov et al., 2013).

4  C’est souvent une liste unique de synonymes qui est fournie dans les dictionnaires en ligne, on parle alors de synonymie cumulative. Exploiter une liste unique de synonymes impliquerait de savoir repérer en son sein les substituts pertinents pour chaque mot-occurrence du corpus susceptible de recevoir une annotation synonymique pertinente.

5  Le Dictionnaire électronique des synonymes est consultable sur le site du laboratoire CRISCO (https://crisco.unicaen.fr/glossaire/des/). Voir aussi (Chardon & François, 2020).

6  Le Robert a commercialisé le Dictionnaire des combinaisons de mots (2007 et 2020) en version imprimée et en a tiré des extractions sélectives et remodelées (tout en gardant l’enchâssement des combinaisons sous des patrons « verbe + X » ou « X + adjectif »). Ces cooccurrents privilégiés sont proposés pour certaines entrées nominales sous l’onglet « combinaison » du Dico en ligne (voir par exemple, s.v. descente, https://dictionnaire.lerobert.com/definition/descente) ou accessibles au moyen d’une icône en forme de nuage dans le Grand Robert. Apparues en 2022, elles sont trop récentes pour avoir été prises en compte dans cette contribution.

7  Pour plus d’informations concernant le correcteur Antidote de Druide Informatique Inc., voir : https://www.antidote.info/fr et https://www.antidote.info/fr/antidote-11/documentation/guide-utilisation/avant-propos.

8  Pour plus d’informations concernant le Robert correcteur coédité par le Robert et les Éditions Diagonal, voir : https://robert-correcteur.lerobert.com/aide-redaction.php et https://www.prolexis.com/le-robert-correcteur/.

9  Toutes les URL de cette contribution ont été contrôlées le 31/07/2023.

10  Dans cette contribution, nous transcrivons les graphies originales des textes dans les citations.

11  Pour plus d’informations sur Tracer, voir le site du projet eTRAP (https://www.etrap.eu/research/tracer/) et Büchler, 2013.

12  Pour plus d’informations sur TextPAIR, voir le site du projet ARTFL (https://0-artfl--project-uchicago-edu.catalogue.libraries.london.ac.uk/text-pair) et Horton, Olsen et Roe, 2010.

13  Le XML, Extensible Markup Language, est un langage de structuration particulièrement adapté aux tâches d’édition. Son vocabulaire n’est pas prédéfini (comme c’est le cas pour le HTML), mais il peut être choisi et adapté en fonction des besoins des utilisateurs. Toutefois, des standards, recommandations ou normes existent pour régir les emplois partagés de ce langage et pour faciliter les échanges de documents. Dans notre projet, nous privilégions le standard TEI:P5 (Text Encoding Initiative), cf. https://tei-c.org/release/doc/tei-p5-doc/fr/html/index.html.

14  Pour plus d’informations sur TreeTagger, développé dans le cadre du TC project, voir http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/ et (Schmidt, 1994).

15  Cette relation est en fait plus complexe qu’un lien entre deux formes d’un même lemme. En effet, la différence de casse permet de passer du nom propre des divinités chthoniennes au nom commun désignant les âmes des morts, Mânes ayant connu une extension d’emploi (antonomase) dans la langue générale.

16  Il s’agit en réalité d’une relation dérivationnelle de conversion, entre l’adjectif qualitatif humaines attesté dans « prières humaines » au sein de la traduction de Héguin et le nom humain complément en de du nom prière dans « prières des humains » au sein de celle de Nisard.

17  Dans le texte latin, nous lisons « Et caligantem nigra formidine lucum ingressus », le bois (lucum) serait donc sombre (caligantem) et la crainte (formidine) noire (nigra).

18  « Umbras recentes » (les ombres nouvelles) ne sont qualifiées par aucun adjectif verbal dans le texte latin. Dans les textes français correspondants, nous valorisons la totalité de la construction utilisée pour traduire l’adjectif recentes.

19  La notion de réciprocité vient d’un posttraitement qui a consisté à rendre symétriques les relations synonymiques extraites des dictionnaires dépouillés : « La base de départ a été constituée à partir de sept dictionnaires classiques. Un premier travail, réalisé par l’INALF (Institut National de la Langue Française), a permis d’en extraire les relations synonymiques. Le laboratoire ELSAP, qui est devenu par la suite le CRISCO, a ensuite concaténé, homogénéisé et symétrisé les données. […] Le DES est symétrique : cela signifie que si un mot est synonyme d’un autre, la réciproque est vraie. En d’autres termes, les liens ne sont pas orientés. Cette propriété découle de la définition de la synonymie en tant que substituabilité en contexte. », cf. https://crisco.unicaen.fr/dictionnaire-electronique-des-synonymes-des/presentation-du-dictionnaire-electronique-des-synonymes/.

20  La notion de clique intervient ici. « Une clique – terme emprunté à la théorie des graphes – est un ensemble maximal de mots tous synonymes entre eux. [… E]lles sont plus proches des concepts que les mots, car elles neutralisent partiellement la polysémie de ceux-ci, ne retenant idéalement qu’un sens donné, commun à tous les mots de la clique. », cf. https://crisco.unicaen.fr/dictionnaire-electronique-des-synonymes-des/presentation-du-dictionnaire-electronique-des-synonymes/.

21  L’article descendre du DES est consultable à l’URL suivante : https://crisco4.unicaen.fr/des/synonymes/descendre.

22  Si une construction factitive (faire V) induit une interprétation en tant qu’action involontaire, le trait [+/- volontaire] est moins facilement décidable pour chaque occurrence verbale que le trait [+/- vers le bas] par exemple.

23  Les 2e et 3e verbes appartiennent syntaxiquement au sujet du 1er, dont la tête est tout.

24  Nous conservons cette référence, mais une nouvelle édition du Dictionnaire des synonymes, nuances et contraires a été publiée en juin 2022 et probablement exploitée pour en dériver les contenus affichés dans la vue « synonymes » introduite dans les Petit Robert et Grand Robert en ligne au printemps 2022. À l’automne 2021 (lors de la préparation de l’exposé préalable à cette contribution), nous avions établi que c’était de l’édition de 2020 du Dictionnaire des synonymes et nuances que dérivait l’affichage des synonymes dans le Dico en ligne, nous n’avons pas trouvé de preuve qu’il y ait eu une actualisation dans ce dictionnaire en ligne avec la publication du Dictionnaire des synonymes, nuances et contraires de 2022.

25  L’article descendre du Dsn-Dico-Robert est consultable à l’URL suivante (onglet « Synonymes ») : https://dictionnaire.lerobert.com/definition/descendre.

26  L’article descendre du GdSC-FreeDic-Larousse est consultable à l’URL suivante : https://fr.thefreedictionary.com/descendre.

27  Les codifications typographiques de cet affichage sont surprenantes : outre le fait que les mises en bleu vs noir des synonymes ne correspondent qu’à la présence ou non de lien hypertexte vers une entrée de dictionnaire, les traitements des expressions descendre de et descendre jusqu’à sont des sous-parties finales du traitement de descendre verbe intransitif, ce que la taille des caractères des indications de rection et de titrage des listes de synonymes des expressions en sous-adresse montre moins bien que dans d’autres déclinaisons de ce texte (comme la version du volume imprimé ou celle sous forme d’arbre proposée actuellement en ligne dans le Petit Robert et le Grand Robert (sur abonnement), mais pas la version texte de ces deux derniers dictionnaires qui met au même niveau les 3 titres structurateurs « verbe intransitif », « expressions » et « verbe transitif »).

28  La présence de « : » après la marque affectée à un synonyme montre bien que la marque est antéposée au(x) synonyme(s) marqué(s), même s’il n’y a pas de virgule qui sépare la marque du synonyme qui la précède mais un tiret accolé à la marque (« décliner, rétrograder -familier: dégringoler. » s.v. descendre verbe intransitif 1.).

29  La question d’un test de validité informatisé, quant à elle, n’est pas abordée à ce stade de notre exposé et constitue une question complexe qui ne pourra pas l’être dans cet article.

30  Les articles épouvante comportent chacun une seule liste, donc :

– dans le Dsn-Dico-Robert, le premier synonyme n’étant pas distinctif, il n’est pas mis en gras,

– et, dans le Ds-DfH-Hachette, la liste est non numérotée.

31  Cette liste unique du Dico en ligne est subdivisée en 3 singletons (dont le synonyme du premier est resté en gras) dans les « synonymes » présentés en « arbre » des Petit Robert et Grand Robert en ligne :

« DESCENDRE [astre] … se coucher

DESCENDRE [nuit] … tomber

DESCENDRE [mer] … se retirer ».

32  Un curieux double traitement de descente aux enfers s’observe dans l’article descente du Dico en ligne :

« Synonymes de descente nom féminin

• pente, déclivité

• chute, affaissement, baisse, dégringolade

• raid, coup de main, incursion, [de la police] rafle

• [d'organes] chute, prolapsus (Médecine), ptose (Médecine)

Synonymes de descente aux enfers

• chute, dégringolade, disgrâce

Synonymes de descente de lit

• carpette, lirette

Synonymes de descente aux enfers

• chute, disgrâce ».

33  Les lexicographes évitent ainsi des multiplier les divisions d’articles afin de n’en créer que pour les distinctions sémantiques majeures.

34  Ils proposent aussi des dictionnaires de synonymes. Celui d’Antidote est de facture classique, alors que celui fourni par les Éditions Diagonal au sein du Robert correcteur sélectionne les emplois au moyen de traits distinctifs : s.v. descendre, « descendre [Sans complmt] [Aller de haut en bas] » vs « descendre [Sans complmt] [Loger qqpart] » vs « descendre (qqch) […le niveau ou la hauteur de qqch] », etc.). Nous ne prenons pas en compte ces dictionnaires dans cette contribution, puisque nous nous limitons à une sélection de ceux des éditeurs majeurs – Hachette Éducation, Larousse et Le Robert –, mais les traits sélecteurs d’emploi du dictionnaire de synonymes du Robert correcteur retiennent notre attention.

35  Dans le Robert correcteur, nous trouvons seulement « descendre le fleuve » s.v. descendre « Sens 1 : aller, parcourir de haut en bas », § « Avec complément direct ».

36  Voir également (Chardon, 2020) qui expose les différentes méthodes de calcul et de visualisation de l’espace sémantique des mots à l’aide de graphes et leur application pour la détermination des cliques et le regroupement des sens lexicographiques. Cette approche, implémentée dans le DES, est accessible sous l’onglet « espace sémantique » de chaque article (pour descendre, voir https://crisco4.unicaen.fr/espsem/descendre).

37 La proximité se calcule à partir du nombre d’arcs qu’il faut parcourir pour arriver d’un nœud à l’autre par le chemin le plus court : dans notre graphe (Figure 3), se précipiter est plus proche de descendre (2 arcs à parcourir) que de venir (3 arcs).

38 Entrer est considéré comme étant au centre du graphe non seulement parce qu’il est lié à plusieurs nœuds, mais aussi parce qu’il est nécessaire de traverser son nœud pour arriver de se précipiter et de plonger vers venir, aller, se glisser et pénétrer, ou encore pour arriver à venir et aller depuis se glisser et pénétrer.

39  L’annotation du corpus pourrait à la rigueur s’envisager sans étape de validation de la pertinence des synonymes “indirects”, extraits d’une liste qui contenait le mot-occurrence annoté ou un de ses synonymes, dans la mesure où

– si un synonyme “indirect” n’est pas attesté dans le corpus (comme viendre, s.v. venir), alors il n’y aura pas de nouvelle correspondance détectée et son effective synonymie avec le mot-occurrence annoté importe peu,

– et si un synonyme “indirect” (comme pénétrer, s.v. entrer et glisser (se) mais sans lien direct avec descendre, ou, plus proche, comme se précipiter, qui a plonger dans ses synonymes, ce verbe ayant descendre dans les siens), est dans de nouveaux extraits liés aussi par des correspondances entre d’autres items, alors la procédure de contrôle de la pertinence des correspondances détectées ne validera celle des verbes que si les liens entre les autres items des extraits sont assez forts pour garantir que la synonymie verbale est effective.

40  Les résultats d’une expérimentation avec word2vec sont plutôt décevants, puisque parmi les verbes proches proposés pour descendre, nous trouvons, outre le synonyme venir (qui est attesté dans le corpus), une majorité de verbes non synonymes des occurrences de notre corpus : traverser, présenter, et même divertir.

41  Certains dictionnaires proposent des attestations, au sein de corpus variés, de l’item en adresse (comme sous l’onglet « Exemples » du Dico en ligne du Robert, où l’on trouve des « Phrases avec le mot […] ») ou de l’item en adresse et d’un de ses cooccurrents privilégié (comme dans le dictionnaire de cooccurrences d’Antidote : « Exemples de la cooccurrence […] »).

Haut de page

Table des illustrations

Légende Figure 1. Exemple de balisage XML TEI:P5 du syntagme nominal « le profond royaume de Pluton »
URL http://0-journals-openedition-org.catalogue.libraries.london.ac.uk/linx/docannexe/image/10203/img-1.png
Fichier image/png, 52k
Légende Figure 2. Extrait de l’article descendre du DES21
URL http://0-journals-openedition-org.catalogue.libraries.london.ac.uk/linx/docannexe/image/10203/img-2.png
Fichier image/png, 153k
URL http://0-journals-openedition-org.catalogue.libraries.london.ac.uk/linx/docannexe/image/10203/img-3.png
Fichier image/png, 62k
URL http://0-journals-openedition-org.catalogue.libraries.london.ac.uk/linx/docannexe/image/10203/img-4.png
Fichier image/png, 44k
Légende Tableau 3. Articles descendre des trois dictionnaires de synonymie distinctive pris en compte
URL http://0-journals-openedition-org.catalogue.libraries.london.ac.uk/linx/docannexe/image/10203/img-5.png
Fichier image/png, 10k
URL http://0-journals-openedition-org.catalogue.libraries.london.ac.uk/linx/docannexe/image/10203/img-6.png
Fichier image/png, 27k
Légende Tableau 5. Articles descendre et dégringoler de l’onglet « Synonymes » d’Antidote
URL http://0-journals-openedition-org.catalogue.libraries.london.ac.uk/linx/docannexe/image/10203/img-7.png
Fichier image/png, 11k
Légende Figure 3. Visualisation en graphe et en listes de synonymes pertinents extraits de l’article descendre et de ceux de ses correspondants dans le corpus (items représentés dans le graphe et soulignés dans les listes extraites des articles du Dsn-Dico-Robert)
URL http://0-journals-openedition-org.catalogue.libraries.london.ac.uk/linx/docannexe/image/10203/img-8.png
Fichier image/png, 70k
Haut de page

Pour citer cet article

Référence électronique

Karolina Suchecka et Nathalie Gasiglia, « Exploration fonctionnelle de dictionnaires de synonymes pour un projet d’humanités numériques »Linx [En ligne], 86 | 2023, mis en ligne le 30 septembre 2023, consulté le 23 mars 2025. URL : http://0-journals-openedition-org.catalogue.libraries.london.ac.uk/linx/10203 ; DOI : https://0-doi-org.catalogue.libraries.london.ac.uk/10.4000/linx.10203

Haut de page

Auteurs

Karolina Suchecka

ALITHILA, ULR 1061, Université de Lille

Nathalie Gasiglia

STL, UMR 8163, Université de Lille

Articles du même auteur

Haut de page

Droits d’auteur

Le texte et les autres éléments (illustrations, fichiers annexes importés), sont « Tous droits réservés », sauf mention contraire.

Haut de page
Rechercher dans OpenEdition Search

Vous allez être redirigé vers OpenEdition Search