Navigation – Plan du site

AccueilNuméros154Résumés des conférencesLinguistique informatique du sans...

Résumés des conférences

Linguistique informatique du sanskrit et tradition grammaticale de l’Inde

Amba Kulkarni
p. 371-373

Texte intégral

1Avec l’avènement du world wide web (www) et les progrès de l’informatique, les chercheurs et le grand public vivent ce que l’on appelle une « explosion de l’information ». D’énormes quantités d’informations sont disponibles dans plusieurs langues. Grâce à la disponibilité facile et généralisée d’un instrumentaire approprié (ordinateurs), les chercheurs développent actuellement différents types de logiciels et de technologies informatiques liés aux langages, tels que l’extraction d’information, les moteurs de recherche, la recherche d’information, les systèmes de réponse aux questions et la traduction automatique. Les questions fondamentales abordées par ces technologies concernent la compréhension des informations codées en langage. L’Inde a une tradition riche et vivante de théories linguistiques avec des contributions des anciennes traditions de la grammaire (vyākaraṇa), de la logique (nyāya) et de l’exégèse (mīmāṁsā). Ces théories traditionnelles fournissent des méthodes pour analyser les langues et les textes de façon objective. Cela les rend utiles en tant que grammaires informatiques. Les ressources traditionnelles de la tradition sanskrite, associées aux outils informatiques appropriés, aident le philologue dans son travail de manière jusque-ici inconcevable. Dans la série de conférences que je propose, j’expliquerai l’importance de ces théories traditionnelles d’un point de vue informatique, je discuterai de la modélisation informatique de certains des concepts linguistiques importants de la tradition sanskrite et démontrerai certains des logiciels qui ont émergé de cette modélisation.

I. Linguistique informatique du sanskrit (31 mai 2022)

2La dernière tendance en linguistique informatique consiste à utiliser des approches basées sur les données (data-driven approaches) associées à des approches telles que l’« apprentissage profond » (deep learning) ou « réseaux de neurones profondes » (deep neural net). Le sanskrit est ici une exception. Nous trouvons rarement des approches basées sur les données (data-driven approaches) utilisées pour le sanskrit. La linguistique informatique du sanskrit est toujours dominée par la forte tradition linguistique. Cet exposé présentera un survol critique de la recherche dans ce domaine. Les linguistes informaticiens travaillant avec le sanskrit sont depuis longtemps attirés par la riche tradition linguistique indienne, avec sa grammaire très complète pour le sanskrit, ses nombreuses ressources lexicales, les théories de la cognition verbale et les textes développant la philosophie du langage. L’œuvre monumentale de Paṇini, l’Aṣṭadhyayi, présente une grammaire presque exhaustive pour le sanskrit, en grand détail, pourtant suffisamment compacte pour pouvoir le mémoriser. Cette grammaire a été utilisée comme source pour le développement de divers outils informatiques pour le sanskrit, tels que des analyseurs (parsers) et des générateurs au niveau des mots et des phrases, des outils pour joindre des mots selon des règles euphoniques, des outils pour la segmentation, etc. L’ensemble des sūtras (règles), un peu moins de 4 000, dans l’Aṣṭādhyāyī ressemble dans une certaine mesure à un programme d’ordinateur, présentant pourtant une différence majeure : le programme a été écrit pour un être humain et non pour une machine. Aussi, il permet des sūtras non formels ou semi-formels qui nécessitent un être humain pour les interpréter. L’Aṣṭā-dhyāyī a attiré l’attention de plusieurs informaticiens qui en ont étudié divers aspects, tels que sa structure, son organisation, les moyens de résolution des conflits entre les règles, etc. Outre les outils informatiques, plusieurs ressources lexicales consultables en ligne, telles que l’Amarakoṣa, Word-Net, Dhātupāṭhas, sont disponibles. Toutes ces ressources, associées aux outils informatiques appropriés, aident le philologue dans son travail de manière jusque-ici inconcevable. Ces outils et ressources constituent un moyen naturel de présenter ou de générer des commentaires électroniques pour divers textes.

II. Théories de śābdabodha (cognition verbale) et l’analyse (parsing) des textes sanskrits (2 juin 2022)

3Les théories indiennes traditionnelles sur le śābdabodha (cognition verbale) fournissent une structure bien définie pour la représentation des connaissances. Cette structure indique comment les divers composants d’une phrase codent différents types d’informations, la quantité de ces informations qu’ils encodent et la manière dont ces informations sont codées. Trois facteurs nécessaires dans les analyses traditionnelles de śābdabodha sont les suivantes : ākāṅkṣā (anticipation syntactique et sémantique), yogyatā (congruité) et sannidhi (proximité). Dans cet exposé, je vais décrire comment ces trois facteurs jouent un rôle clé dans le développement du śābdabodha. Je vais également aborder la quantité maximale d’informations pouvant être extraite mécaniquement d’une seule chaîne linguistique. L’architecture d’un analyseur syntaxique pour la langue sanskrite développé suivant ces théories et impliquant la modélisation de ces trois facteurs sera expliquée en détail et sera suivie d’une démonstration en direct du système.

III. À quel point l’ordre « libre » des mots est-il libre en sanskrit ? (9 juin 2022)

4Comme le sanskrit est une langue riche en flexionalité (c’est-à-dire, riche en formes dans les conjugaisons des verbes et dans les déclinaisons des substantifs et adjectifs), il est généralement admis que l’ordre des mots en sanskrit est libre. Le concept de sannidhi (proximité), l’un des facteurs cruciaux dans le processus de la connaissance verbale, constitue néanmoins une contrainte pour l’ordre des mots en sanskrit. Nous étudions l’ordre des mots libre du sanskrit à la lumière d’un cadre de dépendance (dependency framework). La condition de non-projectivité faible sur les graphes de dépendance capture la contrainte de sannidhi. Cependant, nous avons également trouvé quelques exceptions. Les concepts d’utthita-ākāṅkṣā et d’utthāpya-ākāṅkṣā nous ont aidés à comprendre ces exceptions. En examinant les cas de dislocation dans la prose et dans la poésie, nous avons remarqué que deux relations, à savoir, la relation adjectivale et la relation de génitif, sont plus fréquemment impliquées dans la violation de sannidhi. Ces relations correspondent à ce que la tradition apelle utthāpya-ākāṅkṣā. Nous concluons que les relations impliquées dans la violation du sannidhi correspondent à l’utthāpya-ākāṅkṣā (lit. : « anticipation syntactique-sémantique à soulever »), sauf quelques cas exceptionnels.

IV. Récursivité et mathématiques combinatoires dans le Chandaḥśāstra (16 juin 2022)

5La contribution des mathématiques indiennes depuis la période védique a été reconnue par les historiens. Piṅgala (environ 300 avant J.-C.) dans son livre sur Chandaḥśāstra, un texte traitant de la description et de l’analyse des mètres dans le travail poétique, décrit des algorithmes des mathématiques combinatoires. Ces algorithmes traitent essentiellement du système de nombres binaires : compter à l’aide de nombres binaires, trouver la valeur d’un nombre binaire, trouver la valeur de nCr, évaluer 2n, etc. Tous ces algorithmes sont de nature récursive. Certains de ces algorithmes utilisent également le concept de variables de pile (stack variables) pour empiler les résultats intermédiaires pour une utilisation ultérieure. Pāṇini, qui est considéré comme un contemporain de Piṅgala, a également utilisé la récursivité pour décrire la morphologie des mots. Dans la dernière période, cependant, les algorithmes récursifs ont été remplacés par des algorithmes itératifs. Dans cet exposé, nous décrivons à la fois les algorithmes récursifs et itératifs, et nous les comparons avec des œuvres modernes.

Haut de page

Pour citer cet article

Référence papier

Amba Kulkarni, « Linguistique informatique du sanskrit et tradition grammaticale de l’Inde »Annuaire de l'École pratique des hautes études (EPHE), Section des sciences historiques et philologiques, 154 | 2023, 371-373.

Référence électronique

Amba Kulkarni, « Linguistique informatique du sanskrit et tradition grammaticale de l’Inde »Annuaire de l'École pratique des hautes études (EPHE), Section des sciences historiques et philologiques [En ligne], 154 | 2023, mis en ligne le 22 juin 2023, consulté le 22 mai 2024. URL : http://0-journals-openedition-org.catalogue.libraries.london.ac.uk/ashp/6451 ; DOI : https://0-doi-org.catalogue.libraries.london.ac.uk/10.4000/ashp.6451

Haut de page

Auteur

Amba Kulkarni

Directrice d'études invitée, École pratique des hautes études-PSL — section des Sciences historiques et philologiques, université de Hyderabad (Inde)

Haut de page

Droits d’auteur

CC-BY-NC-ND-4.0

Le texte seul est utilisable sous licence CC BY-NC-ND 4.0. Les autres éléments (illustrations, fichiers annexes importés) sont « Tous droits réservés », sauf mention contraire.

Haut de page
Rechercher dans OpenEdition Search

Vous allez être redirigé vers OpenEdition Search