1L’aptitude au langage, c’est-à-dire à parler une langue, définit l’être humain, et le langage est sans doute l’outil le plus perfectionné façonné par l’espèce humaine dans le cours de l’évolution. Or, dans les premiers âges de sa vie, chaque enfant doit, par lui-même et pour lui-même, reconstruire cet outil. L’étude de ce processus complexe constitue un vaste domaine interdisciplinaire de recherches, aussi richement diversifié qu’intensément exploré. En effet, si le développement de la capacité langagière est peut-être celui dont l’enjeu est le plus crucial, cette capacité n’est assurément pas la seule développée durant l’enfance. Elle entretient des relations étroites avec un nombre important d’autres capacités à développer : mémoire, attention, catégorisation, socialisation, etc. Ce sont précisément ces relations entre le développement de la faculté de langage et celui d’autres capacités cognitives qui sont au cœur des débats les plus animés.
2L’acquisition du langage démarre à l’identique chez tous les enfants du monde. Les cinquante premiers mots émis par l’enfant ainsi que les premières combinaisons qu’il réalise sont pourvus d’un contenu de sens extrêmement proche (Clark 1979 ; Slobin 1972). Une telle ressemblance dans les significations exprimées durant la deuxième année de la vie plaide en faveur de l’hypothèse selon laquelle le point de départ de l’acquisition du langage consisterait dans un stock de catégories conceptuelles, prélinguistiques et universelles dont disposerait l’enfant. Toutes les langues offrent des instruments pour exprimer les concepts d’agentivité, de localisation, de possession, de résultat, d’existence, etc. ; et, partout dans le monde, les enfants savent trouver, tôt dans le développement de leur aptitude à parler, les moyens d’exprimer ces concepts (Maratsos 1983). Bien que les procédures mises en œuvre par l’enfant ne soient pas toujours accordées avec la langue parlée par l’adulte, le fait que les concepts encodés par les enfants au début du processus d’acquisition soient partout si proches constitue un argument puissant pour postuler une base prélinguistique universellement détenue.
3Cependant, bien que la possession de ces fondations cognitives en soit une condition nécessaire, elle n’est pas suffisante pour permettre l’acquisition du langage. L’enfant a également besoin d’interagir avec l’adulte afin de découvrir comment les catégories prélinguistiques sont, ou ne sont pas, « encapsulées » dans la grammaire de la langue qu’il est en train d’acquérir. Selon Jean Piaget (1952), la pensée conceptuelle n’est pas créée par la langue. Au contraire, la pensée servirait de catalyseur pour l’apprentissage du langage, lequel serait, par la suite, susceptible de modifier les contenus de pensée. Toutefois des recherches récentes ont mis en évidence l’importance de la confrontation entre les catégories prélinguistiques et les catégories véhiculées par la langue parlée dans l’environnement adulte. Pour Melissa Bowerman (1994), par exemple, il n’y aurait pas d’étape initiale durant laquelle la grammaire de l’enfant serait le produit exclusif des concepts installés par la cognition prélinguistique. Dès le début, forme linguistique et sens conceptuel feraient l’objet d’une analyse conjointe et le jeune enfant serait sensible non seulement aux formes linguistiques utilisées pour coder du sens mais également à la façon dont les significations elles-mêmes seraient structurées dans et par l’expression linguistique.
4Dans cet article, nous exposerons quelques pièces du débat concernant la question difficile des invariants et des variants dans le processus d’acquisition du langage. La première partie de notre discussion portera sur l’interaction langagière entre l’enfant et son environnement. Tout langage se construit, en effet, à partir de la nécessité de communiquer et de partager de l’information. L’acquisition d’une langue fait, par conséquent, partie intégrante de la socialisation de l’enfant au sein de sa communauté. Les travaux menés dans une perspective transculturelle sur la communication adulte-enfant révèlent les différences considérables existant d’une société à l’autre et prouvent qu’en faisant l’apprentissage de sa langue l’enfant entre en même temps en possession de sa culture. Nous tenterons ensuite de montrer que, dans le processus d’appropriation de sa langue, l’enfant doit opérer un travail complexe de segmentation du signal sonore continu, d’extraction des unités pertinentes et d’attribution de sens à ces unités. Toute langue, en effet, procède au codage de l’information afin qu’elle soit transmissible en temps réel. Pour ce faire, une langue peut exploiter l’intonation, l’ordre des unités ou encore l’empaquetage de l’information dans la morphologie. L’enfant est mis de ce fait dans l’obligation de découvrir les moyens conventionnels d’encodage de l’information en se basant sur le langage perçu dans son environnement. Ce sont les moyens de cette découverte qui seront rappelés ici. Enfin, dans une troisième partie, nous nous pencherons sur les procédures d’attribution de signification et nous examinerons le lien entre développement conceptuel prélinguistique et développement langagier.
5Les études éthologiques des interactions ont montré comment l’enracinement du langage dans son cadre pragmatique était lié aux actions et aux interactions : c’est, en effet, l’action qui permet la segmentation des actes, la différenciation des actants, la socialisation de l’attention portée à l’objet et à ses caractères différentiels, l’interprétation affective des mimiques, des gestes et de l’intonation et, au travers du caractère gratifiant des échanges, la valorisation de la communication pour elle-même. Or les interactions mère-enfant ne se déroulent pas de façon aléatoire, au coup par coup ; elles manifestent, comme y a insisté Jerôme Bruner (1985), une certaine « systématicité » permettant à l’enfant de faire l’apprentissage des structures d’action, lesquelles constituent une véritable syntaxe interactionnelle d’où émergent le lexique et la grammaire.
6Contrairement au point de vue développé par Noam Chomsky (1965), la langue utilisée par les adultes, interagissant avec des enfants d’un âge compris entre 18 et 36 mois, n’est aucunement une langue « dégénérée » contenant des phrases réamorcées ou inachevées. Les recherches menées durant les trente dernières années ont montré que la langue parlée aux enfants par les adultes est seulement différente de celle utilisée dans la communication entre adultes, et cela à tous les niveaux de l’analyse linguistique : phonologie, syntaxe, sémantique et pragmatique (Snow 1995).
7Parmi les modifications opérées sur le signal sonore, on constate que la langue modulée se caractérise par un débit ralenti, une hauteur de ton élevée et une intonation exagérée (Philips 1973 ; Garnica 1977). Plusieurs études ont montré que les mères privilégient les phrases courtes, aisément intelligibles et pleinement grammaticales (Nelson 1973 ; Philips 1973 ; Shatz & Gelman 1973 ; Newport 1975 ; Snow 1977). On note peu d’hésitations, de faux départs ou de phrases interrompues (Broen 1972 ; Newport 1975 ; Snow 1972, 1977). Les mères répètent partiellement ou en totalité leurs propres phrases et, tout aussi bien, celles de leurs enfants, en procédant souvent à des expansions grammaticales ou à des extensions sémantiques (Snow 1972, 1977). Les unités de traitement qui constituent le signal sonore sur lequel l’enfant travaille diffèrent considérablement, par conséquent, de celles utilisées dans l’interaction entre locuteurs adultes ; elles s’en distinguent notamment par leur taille réduite et par une tendance marquée à la redondance.
8La syntaxe utilisée par l’adulte interagissant avec l’enfant est également simplifiée. Les constituants sont souvent isolés dans l’énonciation ; la structure des phrases est peu complexe et ne présente qu’un nombre limité de transformations : il y a moins de phrases subordonnées et coordonnées (Philips 1973 ; Shatz & Gelman 1973 ; Newport et al.1977 ; Snow 1972, 1977).
9Enfin les relations sémantiques encodées dans les énoncés prononcés par des adultes à destination d’enfants sont réduites en nombre. Il arrive fréquemment qu’un seul mot soit utilisé pour désigner toute une classe d’objets : « tasse », par exemple, pour référer à une timbale, une tasse à café, un verre, etc. (Blount 1972 ; Anglin 1977). Les mères parlent de : « Maintenant, ici, toi et moi » (Shatz & Gelman 1973 ; Snow 1972, 1977) ; elles font référence à des objets visibles, à des actions immédiates, facilement repérables dans un contexte donné. Ce « deixis conversationnel » vise à mettre en relation avec le plus de clarté possible discours et situation : adultes et enfants en interaction évoquent des personnes et des objets présents, des actions qui se déroulent au moment précis de la communication.
10Pourquoi ces adaptations ? Il est évident que ce type particulier de discours à usage de l’enfant facilite l’intercompréhension. Shipley, Smith et Gleitman (1969) et Snow (1972) ont pu démontrer que la capacité d’attention et de compréhension de l’enfant à 2 ans diminuait en fonction de la complexité structurelle du discours adulte. D’une part, les pauses nettement faites entre des phrases concises permettent à l’adulte de contrôler que l’enfant le comprend ; d’autre part, cette adaptation du discours adulte facilite le travail de l’enfant en l’aidant à procéder par étapes successives. En outre, les modifications introduites par l’adulte dans ses procédures d’énonciation indiquent très clairement à l’enfant à quel endroit du discours il peut prendre la parole ou encore signaler qu’il comprend, ou ne comprend pas, le message qui lui est adressé.
11Garnica (1977) considère que les modifications observées dans la langue modulée obéissent à plusieurs objectifs. Elles servent à la fois une fonction analytique (informationnelle) et une fonction interactionnelle. D’après son étude des facteurs prosodiques et paralinguistiques à l’œuvre dans le discours adressé aux enfants âgés de 2 à 5 ans, il apparaît que certaines modifications facilitent l’analyse par l’enfant du contenu proprement linguistique du discours. Par exemple, les pauses faites et les intonations montantes en fin de phrase lui signalent la complétude d’une unité linguistique. L’accent exagéré placé sur les substantifs et sur les verbes attire l’attention de l’enfant sur les unités proprement informatives des énoncés. En même temps, d’autres caractères de la langue modulée remplissent une fonction davantage interactionnelle, à savoir assurer le réglage de la conversation entre l’adulte et l’enfant et maintenir l’attention de ce dernier. L’intonation montante en fin de phrase lui indique qu’il est à même de prendre son tour de parole s’il le souhaite. Il convient de remarquer que les éléments de discours remplissant des fonctions interactionnelles tendent à perdre de leur importance au fur et à mesure des progrès de l’acquisition linguistique tandis que ceux liés aux fonctions informatives continuent à jouer leur rôle dans le discours adressé aux enfants de 5 ans.
12Il est clair aussi que l’interaction adulte-enfant répond à des objectifs d’ordre pragmatique, en matière de cohérence conversationnelle. Les expansions syntaxiques – lorsque la mère répète l’énoncé de l’enfant en y ajoutant du matériel lexical ou syntaxique – servent à montrer la forme correcte au moment opportun, c’est-à-dire à l’instant où le besoin de communication est le plus intense. Les extensions sémantiques – lorsque la mère ajoute du contenu à la phrase enfantine – apportent, quant à elles, leur contribution à l’apprentissage de la pertinence dans l’échange conversationnel.
13La description livrée ici du discours modulé ne vaut pas universellement. Les recherches menées dans une perspective transculturelle démontrent, en effet, que les sociétés diffèrent entre elles du point de vue de ce qui est jugé comme un mode de communication approprié. L’interaction adulte-enfant est donc un moyen de socialisation : l’enfant y apprend les usages sociaux de la parole ; il y développe sa compétence à échanger linguistiquement selon les formes. Les contextes dans lesquels un enfant s’approprie sa langue varient en conséquence d’une culture à l’autre et cette diversité s’observe de façon privilégiée en comparant les différentes modalités d’interaction adulte-enfant.
14Une manière d’aborder la variabilité culturelle dans l’utilisation de la langue consiste à caractériser les différences de fréquence et d’intensité dans les comportements de communication ainsi que les situations dans lesquelles ces comportements se déroulent (Ochs 1985). Certes il est rare qu’un comportement de communication observé dans une société n’ait pas son équivalent dans une autre. Par exemple, les échanges de conversation de pure routine au cours desquels il est demandé à l’enfant de répéter – « dis bonjour » ou « dis merci » – se retrouvent dans toutes les sociétés. Pourtant, la fréquence de ces échanges et les contextes particuliers dans lesquels ces demandes adressées à l’enfant sont appropriées ou même valorisées peuvent varier considérablement d’une société à l’autre. En France, des formules telles que « dis bonjour » ou « dis merci » sont rarement répétées plus de deux ou trois fois. En revanche, chez les Kwara’ae des îles Salomon (Watson-Gegeo & Gegeo 1986), ou chez les Basotho du Lesotho en Afrique du Sud (Demuth 1986), cette invitation routinière à répéter, destinée à inculquer l’usage socialement approprié de la parole, se déploie beaucoup plus longuement et est plus fréquemment employée.
15Chaque société développe ses propres conceptions des droits et devoirs des enfants, de ce qu’il convient d’attendre de leurs capacités et de leur personnalité dans les différentes phases de leur croissance (Whiting & Whiting 1975 ; Dentan 1978 ; Ninio 1979 ; Snow et al. 1979 ; Riesman 1992). Prenons, par exemple, les différences dans la manière dont les mères regardent leurs nourrissons chez les Kaloulis (Nouvelle- Guinée) et dans les cultures occidentales. Les mères kaloulis ne disposent pas leurs enfants face à elles (Schieffelin 1985) à la manière des mères des pays occidentaux (Jaffe et al. 1973). Schieffelin explique ce contraste comportemental par une différence de signification attachée au regard dans une situation d’interaction langagière. Le codage culturel des contacts visuels n’est pas le même. Chez les Kaloulis, les interlocuteurs évitent normalement de se regarder dans les yeux car tout regard appuyé peut être considéré comme une manifestation d’agressivité. Il s’agit moins d’une opposition radicale entre le fait de regarder (chez nous) et de ne pas regarder (chez eux) que d’une évaluation différente de la durée de temps jugée convenable pour regarder son interlocuteur.
16Blount (1972) et Schieffelin et Ochs (1983) mettent en évidence, dans leurs travaux, l’importance des contraintes qu’imposent à l’échange de conversation tant les conventions sociales que les représentations culturelles de l’enfance. Par exemple, les parents luos et samoans attribuent aux enfants un statut social inférieur. C’est pour cette raison que le discours que leur adressent les adultes est extrêmement directif : il vise, d’une part, à encadrer et façonner les conduites non verbales et, d’autre part, à limiter globalement le temps de parole concédé aux enfants. En revanche, dans les classes moyennes américaines, on considère que le statut des enfants n’est guère éloigné de celui des adultes ; d’où la tendance à leur conférer une certaine marge d’autonomie dans la gestion de leurs comportements. Le discours adulte comporte pour cette raison davantage de questions du genre « tu veux te coucher ? » et moins d’injonctions du type « va te coucher ! ».
17Schieffelin et Ochs (1983) interprètent les adaptations, manifestes dans la langue parlée par l’adulte à l’enfant dans les classes moyennes des Etats-Unis, comme le signe d’un malaise ressenti face à une inégalité de compétence (« discomfort with the competence differential »). Cet écart entre compétences est réduit au moyen de deux stratégies simultanément mises en œuvre. D’abord l’adulte simplifie son propre discours de façon à le rendre proche du discours enfantin (stratégie de self-lowering : l’expression est empruntée à l’analyse des comportements entre membres de castes différentes). Ensuite l’adulte se conduit comme si l’enfant était plus compétent que son comportement général ne le laisserait voir (stratégie du child-raising).
18Ainsi les mères occidentales issues des classes moyennes tendent-elles à simplifier leur discours et à modifier les contributions des enfants aux interactions langagières afin d’installer ces derniers dans la position d’émetteurs de messages. Elles procèdent de la sorte en fonction de présupposés d’origine culturelle : l’enfant participerait de plein droit à l’interaction en étant tout à fait capable de comprendre et de communiquer. C’est afin d’aider au développement de ces capacités tenues comme émergentes que les mères transforment leurs propres comportements et interprètent les énoncés enfantins. Schieffelin et Ochs (1983) font l’hypothèse que ces présupposés sont absents dans nombre de sociétés. Les mères kaloulis, par exemple, s’abstiennent d’interpréter les énoncés minimaux des enfants en fonction de la croyance culturelle selon laquelle il est impossible d’accéder aux pensées ou aux sentiments d’autrui. Elles n’interprètent pas davantage le regard ou les émissions végétatives des nourrissons (leurs rots, par exemple) comme étant le signe d’une certaine volonté de communiquer puisque, selon les représentations kaloulis, les nourrissons sont incapables d’émettre des messages. A Samoa, les mères ne se livrent pas à l’interprétation des énoncés d’enfants en cours d’acquisition du langage et elles ne simplifient pas le discours qu’elles leur adressent. Cette attitude est cohérente avec une organisation sociale très hiérarchisée au sein de laquelle c’est à l’individu doté du statut le plus bas qu’il incombe d’œuvrer à l’intercompréhension et non à celui situé plus haut dans l’échelle sociale (Ochs 1985). En revanche, face à un interlocuteur étranger d’âge adulte, les Samoans emploient un discours volontairement simplifié afin d’assurer l’intercompréhension.
19Pour conclure brièvement, la socialisation de l’enfant débute au berceau et les empreintes de conceptions culturelles se déchiffrent au travers de toutes les formes d’interaction entre l’adulte et l’enfant. Il n’en reste pas moins que, en dépit des différences de contexte dans lequel les enfants évoluent, tous construisent le langage parlé dans leur environnement. C’est cet aspect du travail enfantin dont nous allons maintenant traiter.
20Pour évaluer à sa juste mesure la contribution de l’enfant à la construction de sa langue, penchons-nous sur la photo ci-contre qui évoque un événement banal et quotidien dans l’existence d’un enfant polonais de 16 mois. Le flou de la parole maternelle accompagnant cet événement est un parfait exemple du genre de données langagières à partir desquelles l’enfant construit son langage. Si notre lecteur est aussi performant que l’enfant, il est arrivé à la conclusion que « chien » se dit pieska ou piesek en polonais.
21Le très jeune enfant met en œuvre la tâche d’acquisition lexicale en procédant par toute une série d’hypothèses. Par exemple, l’enfant présuppose, comme le lecteur, que les deux mots pieska et piesek font référence au chien dans son entier et non pas seulement à l’une de ses parties, sa queue, par exemple, ou son collier. En effet, pour établir une correspondance entre une séquence de sons et un objet dans le monde, l’enfant est doté du principe opératoire selon lequel une étiquette nouvelle réfère à un objet complet et non à une de ses parties, à sa texture ou à d’autres propriétés possédées par cet objet (Markman 1990). Le jeune enfant postule également que le premier mot entendu et appliqué à un objet fait référence à un niveau de base, ici « chien » par exemple, et pas à une catégorie subordonnée (subordinate) – « caniche », par exemple – ou superordonnée (superordinate) – « animal ». De plus, enfants et adultes font l’hypothèse selon laquelle des mots différents possèdent des significations différentes (Clark 1987 ; Waxman & Senghas 1992). Lorsqu’un enfant entend un mot nouveau, désignant un objet dont il connaît déjà le nom, il a tendance à interpréter ce dernier comme faisant alors référence à une catégorie subordonnée ou superordonnée (Waxman & Senghas 1992 ; Waxman 1995). Lorsqu’un mot qu’il connaît lui est présenté avec un adjectif nouveau (« petit » chien, chien « méchant »), l’enfant considérera que ce dernier désigne une propriété saillante de l’objet désigné par le mot, sa substance ou encore une partie de cet objet (Markman & Wachtel 1988).
22Dans l’illustration présentée ici, il y a deux mots qui font référence au chien : pieska et piesek. Comment fait l’enfant pour comprendre que pieska signifie « chien » lorsque le chien est objet perçu et piesek « chien » lorsqu’il est acteur d’une action ? Pour un lecteur adulte, ces deux notions se nomment respectivement « accusatif » et « nominatif ». En revanche, l’enfant, qui ne dispose pas de ces notions grammaticales, est contraint de catégoriser le mode de distribution de ces deux appellations de « chien » en exploitant l’information livrée par le contexte (dont lui-même, le chien et son interlocuteur sont partie prenante), en se basant sur l’input auditif reçu. A partir de cet input auditif, consistant en un signal sonore continu, l’enfant doit extraire les unités pertinentes et découvrir la logique de leur distribution en fonction du sens attribué. Le problème de départ, consistant à extraire des unités dans un signal continu, implique, pour être résolu, que l’enfant soit capable de reconnaître et de mémoriser des séquences de sons récurrentes auxquelles un sens et une fonction sont attribués.
23Slobin (1985) défend l’idée suivante : puisqu’il existe des différences très nettes de complexité formelle entre les structures des diverses langues, il est nécessaire de faire appel à une méthodologie translinguistique si l’on veut réellement comprendre la relation entre langue et cognition. L’étude d’une seule langue est, à l’évidence, insuffisante. Le but de l’entreprise est de découvrir les mécanismes d’acquisition du langage et les activités mentales présupposées par ces mécanismes en comparant les grammaires construites par les enfants de langues maternelles différentes.
24L’organisation morphophonologi-que de la langue parlée dans l’environnement enfantin peut faciliter ou, au contraire, compliquer l’opération d’extraction des unités. Certaines langues, en particulier les langues isolantes, semblent être organisées de façon à rendre aisé le découpage d’unités continues en morphèmes. Par exemple, la morphologie grammaticale d’une langue comme le mandarin est presque inexistante et peu de processus phonologiques brouillent les frontières entre mots (Erbaugh 1982).
25La syllabe et l’accentuation paraissent jouer un rôle important dans le processus d’extraction. Une langue comme le hongrois, dans laquelle la diction de presque chaque mot à contenu sémantique débute avec une syllabe accentuée, facilite assurément le découpage des phrases en mots (MacWhinney 1985). Mithun (1989) a pu montrer, dans son étude de l’acquisition du mohawk qui est une langue polysynthétique, que le morphème comportant l’accent tonique sert de tremplin à l’enfant confronté à des mots qui sont toujours multimorphémiques. En mohawk, les frontières morphologiques coïncident avec les frontières syllabiques. L’enfant commence donc avec la syllabe portant l’accent tonique pour appliquer son attention, dans un second temps, aux suffixes, puis aux préfixes aux syllabes accentuées. En revanche, quand les frontières morphologiques ne coïncident pas avec des frontières syllabiques et qu’il n’est pas possible de se servir comme indicateur de l’accent tonique, l’enfant est contraint de prendre le mot multimorphémique comme point de départ pour son travail. Fortescue (1984-1985) a étudié l’acquisition de l’esquimau groenlandais, une autre langue polysynthétique très riche en processus d’alternance morphophonologique. Il a émis l’hypothèse suivant laquelle la voie standard d’acquisition de cette langue implique un processus d’analyse par décomposition : l’enfant prend le mot multimorphémique (amalgame, chunk) comme base de départ puis décompose les mots en relations paradigmatiques (slots and fillers). Autrement dit, en mohawk, on irait du morphème au mot et, en inuit du Groenland, du mot au morphème.
26Slobin (1982) passe en revue un certain nombre de faits concernant le turc, langue agglutinante, afin de tenter d’expliquer la précocité de l’acquisition de la morphologie nominale turque. Les racines nominales et verbales en turc sont généralement monosyllabiques et comportent des postpositions monosyllabiques. Ces postpositions, classiques dans les langues où le verbe est placé à la fin de la phrase, ne sont pas réduites par des règles phonologiques ; elles s’attachent aux racines dans un ordre invariable et n’ont qu’un seul sensou une seule fonction grammaticale. Toutes les variations allomorphémiques sont gouvernées par des règles d’harmonie vocalique s’appliquant à l’ensemble des mots : il n’y a pas de genre grammatical ou de classe de verbes. Les paradigmes sont réguliers, avec très peu d’exceptions. Les mêmes flexions de cas s’appliquent aux noms, aux pronoms, aux démonstratifs et aux interrogatifs. Manifestant une très grande régularité, les morphèmes fonctionnels, toujours obligatoires sur les noms, sont donc très fréquents. Même dans les réponses ne comportant qu’un mot, par exemple un nom propre à la question « qui as-tu vu ? », le morphème accusatif est obligatoire sur le nom. Finalement les morphèmes n’exhibent que très peu d’homophonie. L’enfant turc est donc entraîné, dès le début du processus d’acquisition de sa langue, à prêter attention à la morphologie. Sa langue favorise, de ce fait, l’extraction des unités.
27L’information véhiculée par une forme peut aussi ajouter de la saillance pour l’enfant. En français, par exemple, la fonction sujet est obligatoire et le clitique-sujet, dépourvu d’accent tonique et souvent réduit (clitique : pronom se situant dans une phrase dans la proximité d’un verbe, ndlr). Nous pouvons alors comprendre comment un enfant peut formuler l’hypothèse selon laquelle la combinaison « clitique + verbe » constitue une seule unité comme dans « j’veux ». En revanche, dans une langue comme l’italien, la fonction sujet ne nécessite pas l’utilisation d’un clitique puisque l’information nécessaire pour détecter le sujet du verbe est à rechercher dans la morphologie verbale. Dans le discours spontané, les adultes italiens omettent le sujet dans 70 % des énoncés (Bates 1976). Dans le reste des cas, les énoncés sont soit des noms, soit un pronom utilisé pour établir un contraste. L’utilisation précoce de pronoms sujets en italien indique alors que l’enfant a procédé à une analyse fonctionnelle ; elle n’est pas l’indice d’une forme figée.
28Dans la description des langues, on admet généralement que les séquences sonores, les mots, se divisent en deux grandes classes lexicales : les éléments à contenu sémantique relativement stable et les éléments grammaticaux dont la stabilité et l’unicité sémantiques sont difficiles à cerner. Le substantif « livre », par exemple, appartient à la première classe lexicale et s’applique à toute une série d’objets possédant un certain nombre de caractéristiques comme l’assemblage de feuilles, leur réunion par reliure ou brochage, le support d’un texte, etc. L’objet nommé « livre » reste un livre, qu’il soit posé sur une table, transporté dans une voiture, placé entre les mains d’un lecteur, quel que soit son état, neuf, abîmé ou déchiré, et indépendamment de son possesseur. En revanche, la préposition « à » est incluse dans la seconde classe d’éléments lexicaux, dite « classe fermée » ou encore « foncteurs », dont les membres changent de sens en fonction du contexte dans lequel ils sont utilisés. Dans les phrases « le sac à Jean-Marie », « je vais à l’école », « il est à l’église », « je donne la fleur à Marie », à signifie successivement la possession, la direction, la localisation et la destinataire (à est dit dans ce cas « bénéfactif »).
29Il est parfois difficile d’établir une distinction nette entre items lexicaux et grammaticaux. Les langues ont une histoire et changent avec le temps ; une partie de leur évolution consiste en la transformation d’items lexicaux en items grammaticaux. Au début du siècle dernier, Antoine Meillet (1912) a introduit la notion de « grammaticalisation » pour désigner le processus diachronique au travers duquel un élément autonome passe du statut de mot à celui d’élément grammatical.
30Dans l’étude de l’acquisition du langage, la morphologie est un chapitre privilégié dans la mesure où l’enfant est contraint d’apprendre à repérer une catégorie de faits morphologiques afin de parler grammaticalement. Certes toutes les langues sont à égalité en ce qui concerne l’expressivité : il n’existe aucune langue qui interdise d’exprimer une pensée quelconque. Toutefois la grammaire d’une langue donnée est susceptible d’imposer des contraintes dans la verbalisation d’un élément de l’expérience vécue.
31Par exemple, lorsqu’un locuteur francophone dit « je fume », cette énonciation renvoie à deux états de choses possibles. Soit il s’agit d’une action habituelle, soit l’action à laquelle le locuteur se réfère est en cours de déroulement. Dans le premier cas, une expression alternative est « je fume tous les jours » ; dans le second cas, il existe la possibilité de dire « je suis en train de fumer ». Un anglophone, en revanche, ne dispose pas de cette liberté pour encoder un événement au présent. La grammaire de l’anglais l’oblige à opérer un choix entre état habituel – I smoke – et état en cours – I am smoking. Pour évoquer, en anglais, des actions au présent, le locuteur doit donc effectuer une rapide opération mentale portant sur la distinction à faire entre action dont on est coutumier et action en train d’être menée. En français, cette distinction ne se traduit pas par un choix forcé : elle est optionnelle, elle n’est pas inscrite dans la morphologie. Il serait, évidemment, absurde d’en inférer que francophones et anglophones développent des conceptions différentes du présent et, par conséquent, du temps !
32On assiste actuellement en linguistique à un regain d’intérêt pour l’hypothèse Sapir-Whorf. La version forte de cette hypothèse est la suivante : « Nous disséquons la nature selon les lignes tracées à l’avance par nos langues maternelles » (Whorf 1956, trad. par Bachman et al. 1981 : 46). Si l’on adopte cette version, il faudrait admettre que la perception et l’organisation cognitive du monde sont linguistiquement déterminées. Un enfant en train d’acquérir sa langue percevrait, par conséquent, les choses du monde et les organiserait à travers le filtre constitué par sa langue. Or il se trouve que cette hypothèse, du moins dans sa version forte, se heurte à un fait expérimentalement constaté : l’enfant perçoit les objets de son environnement et organise ses connaissances bien avant l’apparition de ses premiers mots.
33Les relations sémantiques effectivement encodées par la morphologie grammaticale ne constituent qu’un répertoire relativement limité. Certaines notions de l’expérience humaine sont « encapsulées », ou « empaquetées », dans les grammaires de nombreuses langues du monde tandis que d’autres ne se laissent pas aisément apprivoiser grammaticalement. La notion de pluralité, par exemple, est couramment inscrite dans la grammaire (le pluriel) alors que d’autres caractéristiques des objets désignés par des substantifs, la couleur ou l’odeur, ne sont jamais grammaticalisées en dépit du fait qu’elles sont perceptibles et catégorisables par l’esprit humain (Talmy 1978, 1983, 1985, 1988 ; Slobin 1997, 2001).
34Il en découle que l’économie générale de la morphologie grammaticale, à laquelle doit se soumettre le locuteur d’une langue donnée, impose des contraintes sur le système de traitement de l’information en temps réel. Lorsqu’une catégorie est grammaticalisée dans une langue, elle oblige l’individu qui parle cette langue à se livrer à une activité computationnelle extrêmement rapide et fréquemment répétée. C’est pourquoi Slobin (1996) utilise la formule « penser pour parler ». Il ne fait pas référence à la pensée dans son sens habituel, la pensée réfléchie, mais aux opérations de computation nécessaires pour formater des éléments de l’expérience individuelle et les soumettre à un code conventionnel partagé par une communauté sociale. Les distinctions grammaticalisées dans les langues entrent dans l’éventail des distinctions possibles, c’est-à-dire accessibles à l’esprit humain. Les éléments grammaticalisables sont des éléments constitutifs de la cognition humaine.
- 1 En français, par exemple, le mot « tête », dans « tête d’ail » joue le rôle de classificateur de mê (...)
35L’émergence des distinctions grammaticalisées est bien antérieure à l’apparition des premiers mots. Examinons, par exemple, les langues disposant de systèmes de classificateurs 1 au sein desquels certaines caractéristiques des objets sont dûment grammaticalisées. Le japonais est une langue possédant des classificateurs numéraux. Lorsqu’on compte des crayons, on doit dire : « 1 CL1 crayon ». En revanche, lorsqu’on énumère des feuilles, on doit dire : « 1 CL2 feuille ». Les classificateurs sont nombreux et leur choix dépend du genre d’objet concerné. Par exemple, on utilise le classificateur -nin pour compter les êtres humains, le classificateur -hiki pour les animaux en général. Toutefois, on emploiera le classificateur -too pour les animaux de grande taille ou -wa pour les oiseaux. Il existe un très grand nombre de classificateurs pour les objets inanimés. Certains sont spécifiquement utilisés pour les objets valorisés par la culture japonaise : -rin pour les fleurs. D’autres sont employés pour les objets catégorisés de manière plus générale : -hon pour les objets longs et minces (crayons, cigarettes, etc.), -mai pour les objets allongés et plats (mouchoirs, feuilles de papier, etc.). On emploie le classificateur -ken pour les événements ou les incidents.
36Les nombreuses recherches conduites dans le domaine de la reconnaissance des objets chez l’enfant qui ne parle pas encore (Leslie 1984 ; Spelke et al. 1992 ; Baillargeon 1993, 1995 ; Mandler 1988, 1996) ont permis de vérifier que les dispositions nécessaires à la mise en place de nombreux domaines conceptuels sont « opérationnelles » avant l’apparition des premiers mots. Des concepts fondamentaux, comme ceux d’« animal » ou de « véhicule », sont installés vers 6 ou 7 mois ; ceux de « plante », « meuble » ou « outil » suivent rapidement. Le développement prélinguistique est identique chez l’enfant né au Japon ou dans un pays francophone. Il est concevable que le premier puisse mobiliser ces concepts fondamentaux dans sa reconstruction de la morphologie grammaticale japonaise ; en revanche, l’enfant francophone n’est pas confronté à une distribution morphologique gouvernée par la catégorisation des objets selon un principe commandant l’utilisation de classificateurs.
37Pour dresser la liste des catégories conceptuelles virtuellement grammaticalisables, il est envisageable de comparer systématiquement les modes d’expression d’un domaine conceptuel déterminé dans un certain nombre de langues différentes et de tenter de repérer des universaux et des variations. C’est ainsi qu’on procède, depuis plusieurs années, à une typologie des modalités d’expression des relations spatiales statiques (Pick & Acredolo 1983 ; Svorou 1993 ; Bloom et al. 1996 ; Nuyts & Pederson 1999). Ces travaux montrent par exemple que, dans les langues prépositionnelles, les relations de contenance, de contact et de support sont souvent grammaticalisées bien que les correspondances entre prépositions et relations spatiales puissent différer d’une langue à l’autre. Même des langues proches entre elles, comme l’anglais, l’allemand et le néerlandais, encodent différemment les relations de support. Les figures ci-contre, adaptées d’après Bowerman (1989), présentent toute une série de variations concernant cette relation sémantique.
38L’anglais n’utilise qu’une préposition, on, pour tous les cas de figure présentés : (a) a cup on a table (une tasse sur une table), (b) a picture on a wall (une image sur le mur), (c) leaves on a twig (des feuilles sur une tige), (d) a napkin ring on a napkin (un rond de serviette sur une serviette), (f) a band-aid on a man’s shoulder (un pansement sur l’épaule d’un homme), (f) a band-aid on a man’s leg (un pansement sur la jambe d’un homme), (e) a fly on a window (une mouche sur une fenêtre).
39En revanche, l’allemand recourt à trois catégories : auf pour (a) et (f), an pour (b), (c) (e) et (g), um pour (d). Cette langue opère une distinction entre contact sur une surface horizontale et contact sur une surface non horizontale. Si la relation entre les deux objets en contact implique une surface horizontale, comme c’est le cas pour (a) et (f), on emploie la préposition auf ; si la surface n’est pas horizontale, comme dans les cas de figure (b), (c), (e) et (g), c’est la préposition an qui est employée. Enfin, si la relation de contact implique un encerclement (d), on utilise la préposition um.
40Le néerlandais, pour sa part, organise l’expression de ces relations à l’aide de trois catégories, dont l’organisation diffère de celle de l’allemand. Le cas de figure décrit dans l’image (d) appelle dans les deux langues une préposition spécifique : om en néerlandais et um en allemand. Comme en allemand, les images (a) et (e) sont encodées en néerlandais par une seule et même préposition op (auf en allemand) ; toutefois, à la différence de l’allemand, op est utilisé pour (f) et (g) là où l’allemand utilise an. Le néerlandais ignore la distinction reposant sur l’horizontalité ou la non-horizontalité de la surface de contact. La distribution des prépositions est fondée sur les modalités de l’attachement. Si l’objet adhère en un point fixe et le plus souvent s’il s’agit d’une relation de suspension (affiche sur un mur dans le premier cas, cerise sur une tige dans le second), la préposition sélectionnée est aan. En revanche, lorsque l’objet adhère entièrement à la surface de contact (étiquette sur une bouteille) ou lorsque l’objet est animé (mouche posée sur la vitre), la préposition correcte est op.
41L’étude du développement cognitif non linguistique des relations spatiales de contenance, de support et de contact montre que le nourrisson déploie au début des schèmes relativement simples mais que, dans des délais brefs, il apprend des distinctions conceptuelles plus sophistiquées telles que contenance avec ou sans contact, support horizontal vs support vertical (Baillargeon 1995 ; Mandler 1996). Avant même de parler, l’enfant maîtrise les concepts spatiaux ; ils sont installés dans son esprit. Toutefois il lui reste à découvrir comment ces concepts sont linguistiquement organisés dans la langue de son environnement et à transformer cette connaissance non verbale en connaissance propositionnelle.
42Deux processus sont envisageables. On peut faire l’hypothèse que l’enfant dispose d’une conceptualisation prélinguistique : par exemple, la capacité à catégoriser les objets. A partir de là, soit sa langue grammaticalise cette catégorisation, soit sa langue ne l’entraîne pas à exploiter cette catégorisation dans le travail qu’il opère dans le domaine de la morphologie. Tous les enfants disposeraient donc d’un même stock conceptuel prélinguistique, mais la mobilisation de ce stock conceptuel dans le processus d’appropriation du code varierait en fonction des spécificités de chaque langue.
43On peut imaginer également qu’il existe une autre relation entre savoir prélinguistique et acquisition de la langue. C’est l’hypothèse selon laquelle l’enfant serait capable de mettre en œuvre une conceptualisation linguistique non grammaticalisée dans sa langue. Cette hypothèse a été formulée récemment par Eve Clark, selon qui les enfants mobiliseraient des catégories conceptuelles non grammaticalisées dans leur langue (Clark & Carpenter 1989 ; Clark 2001).
44L’utilisation précoce des mots tend à constituer une preuve de l’existence d’une catégorisation primaire des objets analogue à la classification grammaticalisée dans les langues à classificateurs (Clark 2001). La plupart des langues à systèmes de classificateurs incluent dans leurs répertoires trois classificateurs primaires des formes : « rond » (extension en trois dimensions avec un contour sphérique), « long » (extension unidimensionnelle), « plat » (extension bidimensionnelle). Ces distinctions primaires peuvent se combiner avec des distinctions secondaires : par exemple, rigide vs flexible, extension verticale vs extension horizontale, taille relative. L’importance de ces catégories, fonctionnant en tant que principe d’organisation du lexique précoce, se décèle à travers les phénomènes de surextension. Le phénomène de surextension se définit chez l’enfant par le fait d’utiliser un mot désignant une catégorie d’objets plus large que la catégorie désignée par ce mot dans la langue adulte. C’est le cas, par exemple, lorsqu’il emploie le mot « ballon » pour faire référence à tous les objets ronds (pomme, ballon, chrysanthème, etc.) ou lorsqu’il utilise « bâton » pour désigner toutes sortes d’objets longs, minces et non flexibles (canne, parapluie, morceau de bois, etc.). Le caractère cognitivement saillant des distinctions de forme, dans le domaine des objets, a été mis en évidence dans les études sur l’enfant qui n’a pas encore acquis sa langue : c’est la forme et non la couleur, par exemple, qui lui sert d’instrument pour apparier les objets (Anglin 1977 ; Clark 1983 ; Baldwin 1989).
- 2 On trouve de nombreux termes dans la littérature linguistique pour désigner les « participants » : (...)
45Une scène à évoquer, ou un événement, est une entité complexe associant des participants mis en relation par un prédicat. Le locuteur sélectionne pour parler d’une scène ou d’un événement certains éléments et non d’autres. Ce processus de sélection se réalise au travers du choix d’un verbe et dans celui du rôle grammatical assigné aux participants 2. Les participants à l’événement assument des structures de constituants nominaux dans la phrase exprimée. Dans un événement comme « frapper », il est possible de retenir deux participants : un agent (le participant qui est à l’origine de l’action, accomplie de façon intentionnelle) et un patient (le participant qui est affecté par l’action, subie de manière non intentionnelle).
- 3 La sémantique lexicale classe êtres et choses sur une échelle allant du plus animé (le sujet humain (...)
46L’agentivité est déterminée en prenant en compte un certain nombre de critères : la transitivité de l’événement, le degré de contrôle exercé volontairement par l’agent sur son action, le caractère plus ou moins « animé » (animacy) du sujet 3. « Jean », dans la phrase « Jean frappeMarie », est prototypiquement agent de l’action : il est un être humain, contrôlant une action ponctuelle, délibérément effectuée, comportant un effet sur Marie (Hopper & Thompson 1980). « Jean », dans la phrase « Jean voit Marie », est l’expérient (« experiencer », Levelt 1993 ; Lazard 1994) : il n’exerce aucun contrôle volontaire sur son action qui est durative.
47Cette différence dans le degré d’agentivité est grammaticalisée dans la morphologie de nombreuses langues. Les jeunes enfants paraissent être fort tôt attentifs à la distinction entre agent effectuant une action dont il contrôle l’exécution et expérient faisant l’expérience d’un certain état. Budwig (1995) a étudié la manière dont de très jeunes anglophones utilisent les pronoms I et me pour se référer à eux-mêmes. Chez l’adulte, I et me s’opposent en fonction de leurs rôles grammaticaux : rôle de sujet pour le premier et d’objet pour le second. Or Budwig a découvert un autre critère de distribution de ces pronoms dans le parler d’enfants âgés de 20 à 32 mois. Ils utilisent le pronom me ou my lorsqu’ils encodent une action effectuée sous leur propre contrôle : par exemple me jump (« moi saute »), my cracked the eggs (« moi cassé les œufs »), my blew the candles out (« moi soufflé les bougies »). En revanche, lorsqu’ils ne sont pas à proprement parler actifs dans la production de ce qui se passe, ils emploient I : I like Anna (« j’aime Anna » ou « Anna me plaît »), I want my blocks (« je veux mes cubes »). I semble être utilisé pour exprimer les désirs ou les états intérieurs de l’enfant tandis que me ou my apparaissent dans des énoncés comportant des verbes « résultatifs » et des phrases encodant des actions effectuées sous contrôle de l’enfant. Tout semble se passer comme si le choix des pronoms n’était aucunement aléatoire mais manifestait la capacité des jeunes enfants à opérer des distinctions entre types d’événements en fonction du degré d’agentivité et de contrôle exercé sur l’action. Au cours du développement du système grammatical anglais, distribuant selon sa logique propre l’utilisation de I et me, l’enfant se voit placé dans l’obligation de rejeter cette catégorisation conceptuelle précoce afin de devenir un locuteur conventionnel de sa langue.
48L’attribution de propriétés aux objets est un autre exemple de catégories émergentes. Ces propriétés peuvent être soit inhérentes et stables, soit transitoires et temporaires. La langue espagnole grammaticalise cette différence en distinguant un prédicat utilisé pour les propriétés inhérentes (ser) d’un autre employé pour les propriétés transitoires (estar). Le français ne dispose que d’un seul prédicat, être, servant dans les deux cas. Clark (2001) a décrit le cas d’un enfant anglophone qui, dans sa troisième année, semblait recourir à un marquage différent pour les deux types de propriétés. S’agissant d’une propriété inhérente, il faisait appel à des noms adjectivés au moyen d’un -y tandis que, s’agissant d’une propriété transitoire, il adjectivait un nom en lui adjoignant -ed.
49Dans la mesure où la langue anglaise ne grammaticalise pas la distinction entre propriétés, en fonction de leur caractère inhérent ou transitoire, nous pouvons voir, dans la construction de sa langue par l’enfant, un indice, dûment exploité par lui, de cette capacité à trier entre propriétés. Chez un hispanophone, il y aurait convergence entre son hypothèse concernant le principe de distribution de ser et d’estar et le principe grammatical du parler adulte.
50La distinction entre une propriété inhérente et une propriété transitoire s’inscrit dans un continuum conceptuel que les diverses langues du monde vont segmenter à leur façon. Schlesinger (1979, 1995) s’est consacré à l’étude du continuum établi entre les relations dites comitatives (accomplir une relation en collaboration avec autrui), à un pôle, et les relations dites instrumentales (accomplir une action au moyen d’un instrument), à l’autre pôle. Pour ce faire, il a présenté à des sujets, locuteurs de langues différentes (akan, alur, arabe, coréen, finnois, japonais, luo, polonais, serbo-croate, slovaque, swahili, tamil), un certain nombre d’événements en leur demandant de les classer sur un continuum allant des situations les plus comitatives aux plus instrumentales, telles que les unes et les autres sont considérées par la grande majorité des sujets (voir ci-dessous). En français, tous ces événements sont encodés à l’aide de la proposition avec. En swahili, ce continuum est divisé linguistiquement en deux : un morphème étant attribué pour les événements de 1 à 6, un autre pour ceux de 7 à 9. En arabe, le continuum est également segmenté en deux : les événements de 1 à 8 s’opposant aux événements 9 et 10. Il se vérifie donc que chaque langue découpe ce continuum conceptuel en « tranches » grammaticalisées.
51Bien avant l’acquisition des mots, l’enfant est apte à conceptualiser la permanence des objets, à classer les objets en catégories, à établir des relations de causalité ou à relier des objets dans le cadre d’un même événement (Mandler 1996). Ce savoir prélinguistique va servir de tremplin dans l’entreprise consistant à reconstruire la langue présente dans l’environnement enfantin. Cependant, la relation de correspondance entre concepts applicables dès les premiers âges de la vie et outils linguistiques pour l’encodage n’est jamais parfaite. C’est pourquoi l’enfant doit analyser à la fois le sens conceptuel et la forme linguistique pour obéir aux conventions de sa langue.
52Nous avons montré jusqu’ici que le développement linguistique prend appui sur des capacités conceptuelles qui lui servent en quelque sorte de rampe de lancement. S’impose alors tout naturellement la question de l’influence exercée par l’acquisition du langage sur ces capacités conceptuelles. Il existe une immense littérature sur ce sujet et nous nous contenterons ici de souligner l’existence d’une piste de recherche particulièrement prometteuse combinant trois approches distinctes : la comparaison entre langues, l’étude des conduites non verbales et l’approche développementale (Lucy 1992a, 1992b ; Lucy & Gaskins 2001).
53Les deux langues utilisées dans ces recherches sont l’anglais et le yucatec. Elles diffèrent considérablement entre elles dans leur façon de référer aux objets et d’en faire l’énumération. Il est rare que le yucatec, au contraire de l’anglais, marque explicitement le pluriel. En revanche, dans les opérations d’énumération, le yucatec fait appel à un système de classificateurs. Ce système grammaticalise certaines caractéristiques de l’objet et le substantif identifie sa matière. Ainsi une expression comme deux bougies se dit-elle en yucatec ‘un-tz’iit kib ; elle se traduit littéralement comme « 1-long & mince cire ». Le substantif « bougie », en français comme en anglais, sémantise l’objet en tant qu’association d’une matière et d’une forme, tandis qu’en yucatec la matière est « encapsulée » dans le substantif et la référence aux caractéristiques spécifiques de l’objet présente dans les classificateurs comme -tz’iit. L’expérience consiste dans une tâche d’appariement : il est demandé aux sujets, anglophones et locuteurs de yucatec, de classer des objets. Il est alors constaté chez les locuteurs du yucatec que le critère principal d’appariement est la matière, tandis que chez les anglophones la forme est privilégiée.
54Dans un second temps de l’expérience (voir ci-dessus), il est demandé aux sujets, tant anglophones que locuteurs du yucatec, de répartir des objets, susceptibles d’être classés en fonction de leur matière ou de leur forme, en deux tas. Puis l’expérimentateur leur présente un dernier objet et les invite à le placer dans l’un ou l’autre tas. Le résultat de l’expérience démontre, une fois de plus, que le principe d’appariement sélectionné par les locuteurs du yucatec est la matière tandis que les anglophones se fondent sur la forme.
55La même expérience a été réalisée auprès d’enfants yucatec et anglophones, âgés les uns de 7 ans, les autres de 9 ans. Le résultat est le suivant : à 7 ans, on ne constate aucune différence significative entre les deux groupes ; en revanche, la préférence observée chez les adultes se retrouve exactement chez les enfants âgés de 9 ans. Or c’est à cet âge que les enfants yucatec augmentent et diversifient leur emploi des classificateurs. A 7 ans, ils repèrent la variété des classificateurs et sont capables de juger du caractère grammatical ou non des énoncés contenant des classificateurs. Toutefois ils ne maîtrisent la production de la morphologie des classificateurs qu’à partir de l’âge de 9 ans et cette maîtrise, comme en témoigne l’expérience réalisée, transparaît à cet âge dans les tâches non verbalisées d’appariement d’objets.
56La recherche en linguistique se penche sur les langues afin de comprendre, entre autres, le fonctionnement des systèmes grammaticaux. Cette recherche prend en compte les langues telles qu’elles sont structurées dans le parler adulte, autrement dit le résultat d’un long travail d’acquisition et d’appropriation. C’est sur l’étude de ce processus que se centrent les recherches en acquisition du langage puisque les langues sont façonnées par les hommes et que chaque petit d’homme doit les reconstruire au cours de son long développement. Ces recherches nous révèlent donc à la fois le point de départ du processus de construction et les itinéraires conduisant au produit final. Il est donc heureux que les langues aient des « apprenants » ; c’est grâce à eux qu’on en sait plus sur ce qu’ils acquièrent, les langues, et sur ceux qui les ont acquises, les hommes.