1La parole est le propre de l’homme. Les recherches qui la concernent relèvent donc des « sciences humaines ». Elles sont aussi conduites de plus en plus par des physiciens ou des chercheurs issus de sciences orientées vers la production d’instruments (que le CNRS désigne depuis 1975 comme des « sciences pour l’ingénieur » et que des sociologues des sciences comme Terry Shinn nomment la « recherche instrumentale » (Shinn, 2000). Comment des sciences « instrumentales » peuvent-elles se combiner ou même se substituer à des sciences « humaines » ? Comment une telle substitution se traduit-elle dans la définition des objets de recherche et des programmes ? Quel est le sens de cette instrumentation d’une production humaine ? Pour répondre à ces questions, nous allons reconstruire une histoire particulière, celle d’une communauté scientifique hybride (associant des sciences « humaines » et « instrumentales »), la « communication parlée », qui s’est constituée à partir d’une science humaine enseignée dans les facultés de lettres, la « phonétique ».
2Notre objectif dans ce texte est d’analyser les logiques de constitution et d’évolution de cette communauté afin d’éclairer ce qui peut se jouer autour de la frontière entre les sciences humaines et les sciences « pour l’ingénieur ». Nous montrerons en particulier le rôle central de l’instrumentation et des mises en forme intermédiaires de données dans les processus ayant amené les différents chercheurs à interagir. Les instruments peuvent être vus comme des ponts jetés en travers des frontières disciplinaires et contribuant à définir la communauté hybride qui va se constituer en partie autour d’eux. Leur statut dans la recherche (outil ou objectif) est un enjeu pour la définition des priorités de la communauté et le rapport des forces entre les participants. Pour cela, nous tenterons plutôt de saisir de façon dynamique la construction et l’évolution de celles-ci, un peu comme l’avait fait Mullins pour la biologie moléculaire (1972).
- 1 Dans les années 1980, le Groupement de la Communication Parlée (GCP), groupe spécialisé au sein du (...)
3Nous partirons donc d’une communauté existante, le GFCP1, dont l’acte fondateur s’est déroulé il y a un peu plus de trente ans. En 1970, en effet, se tenaient à Grenoble, dans le cadre du Groupement des Acousticiens de Langue Française (GALF), les premières Journées d’Études sur la Parole (JEP). Cette première manifestation allait par la suite se pérenniser puisque la vingtième‑quatrième édition s’est tenue en 2002. Nous chercherons à comprendre la constitution de cette communauté et la façon dont la frontière entre sciences humaines et sciences d’ingénieurs a été mise en jeu dans ce processus.
4Nous commencerons par retracer dans leurs grandes lignes à l’échelle internationale les différents projets scientifiques et techniques impliquant d’étudier empiriquement la parole. Nous montrerons en particulier que les JEP peuvent être vues comme la transposition en France d’une association entre spécialistes du langage et électroniciens ou acousticiens, déjà réalisée aux États‑Unis dans le cadre de certaines universités (Massachusetts Institute of Technology), centres de recherche (les laboratoires Haskins) ou entreprises (les laboratoires Bell). Ensuite nous analyserons les logiques selon lesquelles ces chercheurs français de différentes spécialités et institutions ont été amenés à interagir par aboutir à la constitution d’une communauté hybride. Nous nous intéresserons en particulier aux « incidents de frontières » qui ont marqué la vie de cette communauté, notamment ceux qui ont été l’occasion de définir les rapports entre les chercheurs se revendiquant des sciences humaines et ceux qui se réfèrent plutôt aux sciences pour l’ingénieur.
- 2 Entre autres René Gsell, René Carré, Guy Pérennou, Serge Castan, Jean-Sylvain Liénard, Henri Meloni (...)
5Ce texte s’appuie sur l’analyse de matériaux recueillis dans le cadre de travaux antérieurs (Boë et al., 1993 ; Boë &Grossetti, 1993 ; Boë, 1990 ; Boë & Liénard, 1988‑1989) ou rassemblés spécifiquement pour la présente analyse. Il s’agit d’entretiens auprès des principaux acteurs de la recherche francophone sur la parole2, du témoignage et des archives de l’un d’entre nous (Louis‑Jean Boë) qui fut président du GFCP et membre du bureau de l’association durant plus de vingt ans, des actes des congrès de phonétique, d’acoustique et des JEP et de diverses autres sources mentionnées dans le texte.
6Boë et Liénard (1988-1989) et Carré, Rossi et Wajskop (1992) ont décrit comment la parole a successivement intéressé à partir du XVIIIe siècle les physiologues qui cherchent à en décrire les mécanismes pour prévenir ou soigner les pathologies qui peuvent s’y rattacher, les physiciens qui étudient les moyens d’enregistrer et de reproduire le signal, et les linguistes qui s’intéressent à la parole comme expression physique des langues à partir de laquelle on peut étudier celles‑ci. Avec nos catégories actuelles, on pourrait dire que se trouvent donc impliquées à différents moments dans des travaux sur la parole les sciences de la matière, les sciences de la vie et les sciences de l’homme.
7Au début du siècle, un ecclésiastique français, l’abbé Rousselot, effectue une série de travaux qui consistent à étudier expérimentalement la parole humaine, en faisant appel aux apports de la physiologie et de l’acoustique. Il s’agit d’une approche différente de celle des linguistes pour qui, depuis Saussure, la parole n’est qu’une actualisation de la langue, objet central de leur intérêt. Rousselot fonde en 1882 le laboratoire de phonétique de l’Institut catholique de Paris et sera titulaire en 1923 de la chaire de phonétique expérimentale du Collège de France. Les approches expérimentales se développeront ensuite rapidement et s’accéléreront jusqu’à l’organisation en 1932 à Amsterdam du premier Congrès International de Sciences Phonétiques, dont les thèmes vont de la physiologie aux expérimentations acoustiques et comprennent même une session de démonstration d’appareils de mesure ou d’enregistrement. Plusieurs universitaires américains participent à ce congrès et aux suivants (1935 à Londres et 1938 à Gand), s’inspirant des travaux initiaux de Rousselot pour introduire dans les universités des États-Unis des enseignements et des recherches en phonétique. Le quatrième congrès est d’ailleurs prévu en 1940 à New York à l’Université Columbia avant d’être annulé à cause de la guerre. Parallèlement à la phonétique (et de façon partiellement opposée), des linguistes russes et tchèques développent dans la cadre du « cercle linguistique de Prague » une approche de la parole plus formelle, qu’ils appellent la phonologie.
8Après la guerre, on commence à disposer d’une instrumentation susceptible d’enregistrer, de transmettre, de reproduire et de traiter la voix (Vocoder en 1936, Voder en 1939, Sonagraph en 1946, cf. Boë & Liénard, 1988), ce qui amène des chercheurs spécialistes du développement de ces instruments (des électroniciens en particulier) à travailler régulièrement sur la parole aux États‑Unis. Des collaborations entre linguistes phonéticiens ou phonologues et électroniciens ou acousticiens se développent, en particulier au Massachusetts Institute of Technlogy (MIT) où Morris Halle (un phonologue russe) et Roman Jakobson (un linguiste russe) côtoient des électroniciens (notamment Gunnar Fant venu de Stockholm) et des physiciens. Le même genre d’association se retrouve aux laboratoires Haskins avec un phonéticien (Pierre Delattre), un psychologue (Alvin Lieberman) et un électronicien (Francis Cooper). Des recherches interdisciplinaires sur la parole sont aussi conduites au sein des laboratoires Bell où il s’agit surtout d’améliorer les techniques de transmission.
9Les spécialistes des instruments sont quelques-uns à présenter des méthodes ou des appareillages lors du congrès de linguistique d’Oslo (1957), puis lors du premier congrès de la Société de Phonétique d’après‑guerre (Helsinki, 1961, les congrès suivants auront lieu à Münster en 1964 et Prague en 1967) et ils prendront une place croissante dans le comité d’organisation des congrès (Boë & Grossetti, 1993).
- 3 Même si la parole était déjà constituée en objet scientifique à travers l’opposition opérée par Sau (...)
10Parallèlement à l’évolution des matériels, se met en place et se diffuse une conceptualisation acoustique de la parole distinguant une excitation (la source vocale) et un ensemble de résonateurs (le conduit vocal) qui, en modulant cette excitation, produisent le son, véhicule du sens. Cette émergence progressive d’un corpus de connaissances et de méthodes d’étude trouve sa première formulation synthétique dans l’ouvrage, Preliminaries to speech analysis (1952), signé par un linguiste, Roman Jakobson, un électronicien, Gunnar Fant, et un phonologue, Morris Halle, dont nous avons relaté la rencontre au MIT. Les auteurs proposent dans cet ouvrage une théorie universelle des rapports entre la structure linguistique et le son. Le fait de mettre en avant un objet désigné par un terme d’usage commun3, la parole (speech), et non une discipline particulière (phonétique, phonologie, etc.), marque une évolution importante en autonomisant cet objet par rapport à des problématiques spécifiques qui pouvaient lui être associées jusque-là, au moins dans l’univers académique. À travers ce jeu de désignation s’exprime un changement de statut de l’objet : la phonétique appartient aux phonéticiens, la parole appartient à tous. Cette évolution concerne aussi les problématiques, qui commencent à concerner des objectifs instrumentaux comme la synthèse, la reconnaissance et le codage.
- 4 Entretien avec René Gsell, 1994.
11René Gsell, un universitaire français, alors directeur de l’Institut de Phonétique de Grenoble, assiste en 1957 au congrès d’Oslo, où il fait la connaissance entre autres de Jakobson, de Fant et de Stevens. Il en revient persuadé de l’importance de la démarche expérimentale et « convaincu par Fant, Jakobson et Malmberg que c’est vers l’acoustique [de la parole] qu’il faut se tourner »4.
12L’interaction entre ces différents chercheurs débute plus ou moins simultanément en plusieurs lieux selon des logiques diverses (Grossetti, 1994). Nous nous centrerons ici sur le cas de Grenoble, car c’est là clairement que l’interaction entre les différentes spécialités a été à la fois la plus intense et la plus marquée par les « incidents de frontières » sur lesquels nous reviendrons. C’est aussi à Grenoble qu’ont été organisés les deux congrès fondateurs de ce qui deviendra le GFCP, en 1967 et 1970, les chercheurs des autres sites venant s’agréger à la communauté telle qu’elle s’est formée sur la base des institutions grenobloises.
13On peut faire débuter le processus d’hybridation en 1955 avec l’arrivée au sein de l’institut de phonétique de Grenoble de René Gsell, un agrégé de grammaire ayant étudié la phonétique auprès de Georges Straka (directeur de l’Institut de Phonétique de Strasbourg, dont nous avons vu plus haut qu’il est l’un des tenants de l’approche expérimentale en phonétique). C’est un phonéticien intéressé par l’acoustique, contrairement à Straka, « très méfiant envers l’acoustique et les enregistrements sonores qui ne permettent pas de voir les gestes articulatoires » (Gsell, entretien de 1994). Comme nous l’avons vu, Gsell participe au congrès de linguistique d’Oslo de 1957, première véritable occasion pour ceux qui s’intéressent à la parole de se rencontrer après la guerre, avant l’organisation de nouveaux congrès de Sciences Phonétiques (« Une partie des phonéticiens de sont retrouvés à ce congrès, car il y avait eu un congrès de phonétique à Gand en 1938, et ensuite il a fallu attendre celui d’Helsinki en 1961 », Gsell, entretien de 1994).
14Après le congrès d’Oslo, Gsell est persuadé de la nécessité de développer l’instrumentation :
Fabriquer les appareils de Fant [analyseur et synthétiseur], c’est ça qui m’intéressait, parce que, à l’époque, personne ne savait travailler ni sur l’intonation, ni sur l’accent et les variations d’intensité. […] Je suis arrivé à l’idée […] qu’il ne devait pas y avoir deux acoustiques, une acoustique intelligente pour les physiciens, et une acoustique approximative et grossière pour linguistes, mais il n’y a qu’une seule acoustique. Les phonéticiens doivent utiliser les méthodes acoustiques qui ont fait leurs preuves dans les études physiques (Gsell, entretien de 1994).
15Pour réaliser son projet, Gsell va mener de pair deux stratégies. La première, interne, consiste à faire acquérir par l’institut de phonétique une instrumentation moderne (magnétophone, sonagraphe, analyseur de spectre, etc.) et recruter les techniciens et ingénieurs nécessaires à leur mise en œuvre. En 1961-1962, le rapport de Gsell sur l’Institut comporte une rubrique « Équipement » qui signale que « Grâce à des subventions de la Direction Générale de l’Enseignement Supérieur, de la Direction de la coopération avec la Communauté et l’Étranger, du C.N.R.S., l’équipement des années précédentes a pu être avantageusement complété en appareils de mesure (TEKTRONIX, METRIX, FERISOL), de prise de son (AMPEX 351), d’enregistrement (OSCILLOMINK) et en matériel audiovisuel (cours sur bandes magnétiques, films » (Université de Grenoble, Faculté de Lettres, Institut de Phonétique, rapport d’activité 1961‑1962). L’année suivante, le rapport fait état de l’achat de « matériels variés de prise de son et de reproduction sonore (Nagra III B, Chaîne de Haute Fidélité, Filtres), d’analyse (Spectromètre BK, générateurs variés, etc.) et de matériel audiovisuel. » (ibid., 1962‑1963). En 1963-1964, il évoque « une nouvelle caméra, un audiomètre Peters » (ibid., 1963‑1964). Au seul technicien d’origine s’ajouteront au fil des créations de postes et des stages, deux puis trois ingénieurs. On retrouve la même équipe en 1963‑1964, avec un nouveau membre, M. Strippoli, « Physicien adjoint du CNRS ». Au total sept ingénieurs travailleront à un moment ou un autre à l’Institut de Phonétique, certains sur des postes permanents, d’autres de façon plus temporaire.
- 5 Au cours des années 1960, une collaboration suivie existait entre les informaticiens grenoblois et (...)
16La seconde stratégie, externe, vise à tirer profit de l’environnement scientifique régional. Dans certains cas, ces échanges avec d’autres disciplines se traduisent par des participations à l’enseignement. Ainsi, Jean-Claude Lafon, un spécialiste en otho-rhino-laryngologie de la faculté de médecine de Lyon, fera des cours sur la physiologie de l’audition au sein de l’IPLG. Gsell a connu Lafon à Strasbourg à l’époque où il travaillait avec Straka : « il m’avait été présenté par Straka : “le docteur Laffon est très proche de nous, c’est un oto‑rhino, mais il est phonéticien” » (entretien Gsell, 1994). Bernard Vauquois, directeur du Centre d’étude de la traduction automatique accepte de prendre la responsabilité d’un cours de linguistique appliquée. L’un des collaborateurs de Vauquois, J.-P. Tubach occupera durant un an un poste d’assistant à l’institut de phonétique et développera à partir de 1965, dans le cadre de sa thèse, un système de reconnaissance de la parole destiné à servir d’interface pour la traduction automatique, ce qui est souvent considéré comme le travail fondateur de la reconnaissance de la parole en France. Ce travail utilise de la parole numérisée fournie par le vocodeur d’IBM-La Gaude5. À la fin des années 1960, IBM (qui a entretemps recruté J.-P. Tubach) propose un sujet de thèse sur la synthèse de la parole à une linguiste issue de l’IPLG, Jaqueline Vaissière, qui travaille à La Gaude sous la responsabilité scientifique de Vauquois et de Gsell.
- 6 « À l’Institut de phonétique de Grenoble, on barbouille les langues de chocolat, on met les patois (...)
17Mais c’est surtout à l’école d’électronique de Grenoble, l’ENSERG, que Gsell trouve des partenaires importants pour la recherche. Jean Benoît le directeur de l’école le met en contact avec René Lancia, directeur d’une équipe spécialisée dans l’instrumentation pour la mesure et les systèmes asservis. Gsell lui présente son projet de réaliser des appareils équivalents à ceux de Fant. Lancia propose de définir des thèmes de projets de fin d’études pour les élèves de l’école. Deux d’entre eux, René Carré et Jean Paillé (qui occupera en 1961 un poste d’ingénieur à l’Institut de Phonétique avant de réintégrer l’ENSERG), développeront un détecteur de fréquence fondamentale de la parole, qui donne lieu à une publication collective signée par Carré, Lancia, Paillé et Gsell dans L’Onde Électrique en 1963 (« Étude et réalisation d’un détecteur de mélodie pour analyse de la parole »). La presse locale (Dauphiné Libéré et Progrès Dauphinois rendent compte de ces travaux par des articles enthousiastes6. Grâce à un financement du CNRS, cette collaboration peut s’amplifier par la réalisation d’un synthétiseur : « Paillé a fait la source sonore, Carré a fait un analyseur de formants à filtres » (Gsell, 1994).
18L’article de 1963 décrit l’appareil et donne une idée de la collaboration. Le texte commence par rappeler que la parole peut être considérée
comme un phénomène (…) constitué par la somme de sinusoïdales d’amplitudes diverses mais dont les fréquences seraient toutes multiples exacts de celle d’une composante fondamentale appelée mélodie. (…) La fréquence de la mélodie, variable au cours de la prononciation d’un mot ou d’une phrase, est une caractéristique de la parole que le phonéticien désire connaître (p. 556).
19Les auteurs définissent ensuite leur détecteur :
L’appareil réalisé a pour objet d’élaborer (à partir d’un signal électrique image de la parole, signal délivré par microphone) un signal électrique image de la fréquence de la mélodie. Il est équipé de circuits fonctionnels particuliers (non présents sur les différentes réalisations connues) qui en facilitent l’exploitation. Le montage est à tubes ; une version transistorisée de l’appareil sera réalisée ultérieurement (p. 556).
20Les auteurs affirment fièrement au passage que « La présentation adoptée est compacte, industrielle, comme le montrent les photographies ci-contre » (p. 556), avant d’entrer dans une description technique de l’appareil. Reprenant un circuit de base déjà utilisé par Fant (ce qui est mentionné dans une note de la page 557), le détecteur comprend différents sous-systèmes en amont et en aval de ce circuit (préamplificateur, circuits de regénération et de sélection de la mélodie, circuit d’inversion, circuit de détection de l’enveloppe). La dernière partie de l’article, intitulée « exploitation », probablement celle où Gsell est le plus intervenu, explique l’intérêt de l’appareil :
Pour le linguiste, la connaissance des faits mélodiques tels qu’ils se présentent dans la chaîne parlée est d’une importance capitale : les variations de hauteur sont en effet des indices acoustiques représentatifs des fonctions linguistiques et de facteurs psychologiques variés, indispensables à la compréhension du message parlé (p. 561).
21Des exemples d’utilisation sont donnés (« la phrase « Est-il jeune ? » prononcée par un sujet féminin parisien, et plus loin « C’est plus court » en forme affirmative ou interrogative), avec des graphiques produits par le détecteur. La conclusion s’impose :
Ces exemples ont pu donner une idée des performances et des commodités d’utilisation de l’appareil. Celui‑ci, grâce à ses circuits fonctionnels permet d’effectuer un dépouillement rapide des bandes magnétiques d’un « corpus linguistique » en dégageant les schémas mélodiques selon des critères choisis au gré de l’utilisateur. (p. 562).
- 7 René Carré racontait dans les années 1970 une anecdote dans laquelle Gsell recevant des scientifiqu (...)
22On se situe donc dans une division des tâches où les électroniciens fabriquent pour le « linguiste » un instrument de recherche qui va permettre à celui-ci de mieux traiter un problème classique, celui de l’intonation. Ils se situent donc dans un rôle d’ingénieurs au service d’une ligne de recherche définie par les linguistes ou phonéticiens7.
23Les électroniciens donnent une traduction institutionnelle à cette collaboration en fondant en 1961 à l’ENSERG un « Groupe d’étude pour l’analyse et la synthèse de la parole » dirigé par René Carré, qui deviendra en 1965 le Laboratoire de la Communication Parlée et de l’instrumentation de mesure (LCPIM), dirigé par Lancia, puis le LCP en 1971 (associé au CNRS, ERA 366), que Carré dirigera de 1981 à 1988 au sein de l’ENSERG. Carré ira plus tard faire un séjour au MIT dans le laboratoire de Kenneth Stevens en 1974.
24Mario Rossi et Max Wajskop, deux phonéticiens qui ont travaillé à Grenoble dans le cadre de la collaboration entre l’Institut de Phonétique et l’ENSERG se retrouveront directeurs des instituts de phonétique d’Aix‑en‑Provence et de Bruxelles. Par ailleurs, Gsell a des contacts avec les différents chercheurs français travaillant sur la parole.
25En 1967, les chercheurs français qui s’intéressent à la parole forment un réseau que nous avons cherché à décrire dans le schéma qui suit en distinguant deux types de relations : l’échange scientifique ordinaire (échange d’informations, lecture réciproque des travaux, rencontres) et les coopérations instrumentales que représentent les recherches réalisées en commun en particulier pour la réalisation d’appareils.
26Ce schéma met en évidence deux réseaux un peu différents. Le premier, qui est le réseau d’ensemble obtenu en prenant les deux types de relations met en évidence la centralité forte de l’Institut de Phonétique de Grenoble, qui collabore avec de nombreux autres organismes de disciplines différentes. Derrière ce réseau d’échange scientifique traditionnel se dessine un second réseau, constitué des relations de coopération instrumentale, dont le centre est plutôt l’équipe des électroniciens de l’ENSERG. Ces deux réseaux permettent de comprendre les phases d’institutionnalisation du domaine qui vont se succéder entre 1967 et 1970.
27La première phase d’institutionnalisation s’amorce avec l’organisation à Grenoble les 10, 11 et 12 avril 1967 d’un colloque sur « les structures acoustiques de la parole » à l’initiative de Busnel, le président du Groupe des Acousticiens de Langue Française, de J.-C. Lafon et P. Mounier-Kuhn (Institut d’audiophonologie de Lyon), de R. Gsell (IPLG), J. Benoît (ENSERG), B. Vauquois (CETA).
Figure 1 : Le réseau des équipes françaises travaillant sur la parole en 1967
- 8 Entre autres : S. Castan du laboratoire d’informatique de Toulouse, R. Buron et A. Nemeth du centre (...)
28René Gsell préside le colloque et en rédige les conclusions (publiées l’année suivante dans la Revue d’Acoustique avec les communications). Le colloque attire 127 participants autour de 23 communications couvrant un champ très étendu : phonétique, linguistique, psychologie, physiologie, électronique, informatique, télécommunications, acoustique, acoustique musicale… On retrouve parmi les participants, en dehors des organisateurs et de leurs équipes, des représentants de la plupart des équipes figurant dans le graphique8, auxquels s’adjoignent de nombreux universitaires lyonnais spécialistes d’audiophonologie ou de psychologie. Ce colloque est donc bien la première grande manifestation française du domaine des sciences de la parole. Il est organisé par les responsables des institutions grenobloises et se présente comme un colloque classique structuré en six séances présidées par les organisateurs ou des personnalités scientifiques nationales ou internationales. L’ouverture disciplinaire est importante puisque l’on trouve des chercheurs des sciences de l’homme, des sciences pour l’ingénieur et des sciences de la vie. Tout semble donc en place pour la fondation d’une communauté hybride associant ces trois grandes composantes. Pourtant, ce colloque ne sera pas réédité. Celui qui sera organisé trois ans plus tard manifestera à la fois un resserrement disciplinaire et un changement de génération.
29Entre le colloque de 1967 et les JEP de 1970, plusieurs frottements disciplinaires et générationnels ont eu lieu. Le point le plus important est le départ de René Gsell pour l’Institut de Phonétique de Paris en 1969. Que s’est-il passé ? Tout d’abord, une crise interne à l’Institut de Phonétique où Gsell est contesté, d’abord par les étudiants auxquels il a interdit d’organiser un colloque sur le thème « Linguistique et poétique », ensuite et surtout par ses collaborateurs. Gsell s’est entouré, comme nous l’avons vu, de jeunes chercheurs et d’ingénieurs. En 1968, ces jeunes chercheurs commencent à contester le mode de direction de Gsell, qui a organisé son institut de façon classiquement mandarinale : le personnel du laboratoire est entièrement au service de ses projets de recherche et il est le seul à en gérer les moyens. Or les jeunes chercheurs, probablement influencés par les habitudes différentes des électroniciens avec lesquels ils collaborent, exigent une structuration plus démocratique du laboratoire et la possibilité de publier. Gsell réagit en remettant les postes de Contini et Boë à la disposition du CNRS et il crée une UER avec différents professeurs extérieurs (Vauquois et les audiophonologistes Lafon et Charachon). Après une longue crise à laquelle participent les étudiants et les chercheurs (occupation du bureau du doyen), Gsell, dont la situation institutionnelle est fragile (il est agrégé du secondaire, chargé de cours à l’université), est contraint au départ et deux autres enseignants (linguistes) partiront à sa suite. Il sera nommé maître de conférences à l’Institut de phonétique de Paris.
30Gsell était le lien principal avec les audiophonologistes et plus généralement l’animateur du réseau scientifique que nous avons décrit au moment du colloque de 1967. Privé de tête, l’Institut de Phonétique ne peut plus avoir le rôle fédérateur que lui avait donné son directeur.
31Dans cette situation, l’initiative d’organiser une nouvelle manifestation va venir des chercheurs du sous-réseau de coopération instrumentale. Carré, Rossi et Wakskop donnent dans un article de 1992 leur version de la création du GCP :
En 1961‑62, les signataires de cet article se sont retrouvés tous les trois à Grenoble pour entamer une collaboration qui se révélera très fructueuse, à la fois sur le plan scientifique et pour l’organisation même de la recherche en France. À l’occasion d’un séminaire organisé à Bruxelles en 1968, ils ont jeté les bases d’une stratégie qui devait conduire successivement à la création du groupe Communication Parlée avec ses Journées d’études annuelles, du GRECO Communication parlée du CNRS avec son rôle normatif de coordination de la recherche et d’une mise en œuvre d’opérations d’ouverture internationale (Carré, Rossi & Wajskop, 1992, p. 94).
32En 1968, lors d’un colloque au Japon, Carré réussit à convaincre le président du GALF, Mattei, de créer un groupe spécialisé sur la communication parlée. Le GCP est officiellement créé en 1970 (avec Carré pour président) lors des Journées d’Études de la Parole (JEP).
- 9 « La perception de la parole : orientations et perspectives », par M. Wajskop (Institut de Phonétiq (...)
- 10 Environ un quart des participants selon un comptage effectué à partir des actes du colloque parus d (...)
33Pour les JEP de 1970, organisées à Grenoble comme le colloque de 1967, prévaudra une formule beaucoup plus resserrée, avec une trentaine de participants et quatre conférences9 : peu de thèmes, très ciblés, écartant délibérément une bonne partie des disciplines représentées en 1967. Le comité d’organisation est d’ailleurs totalement différent puisque l’on y trouve J.‑P. Tubach (CETA), R. Carré (ENSERG-LCP), M. Wajskop (directeur de l’institut de phonétique de Bruxelles, ancien assistant de l’IPLG), M. Rossi (Institut de Phonétique d’Aix‑en‑Provence, ancien assistant de l’IPLG), Mme P. Simon (Institut de Phonétique de Strasbourg) et R. Lancia (ENSERG). Aucun des initiateurs du colloque de 1967 n’est là. Aux mandarins de 1967 ont succédé des chercheurs plus jeunes, plus engagés dans les recherches empiriques. Les informaticiens et électroniciens, minoritaires à l’époque10, sont à présent majoritaires, aux côtés des phonéticiens les plus tournés vers l’expérimentation. L’Institut de Phonétique de Grenoble, à l’origine du processus d’hybridation est provisoirement écarté du nouveau groupe. Les frontières de la communauté se sont nettement déplacées.
34Progressivement, les phonéticiens deviennent minoritaires au sein de la communauté : en 1973, lors des troisièmes JEP, huit communications ou tables rondes sur 25 comptent des linguistes ou phonéticiens, les autres étant présentées par des électroniciens ou informaticiens. 21 participants sur 104 sont linguistes ou phonéticiens, les autres étant pour l’essentiel des physiciens, électroniciens ou informaticiens et quelques physiologistes. En 1979, lors des dixièmes JEP, cinq communications sur 39 comptent un membre d’un Institut de Phonétique parmi leurs auteurs. Deux thèmes étaient proposés, l’un tourné vers la réalisation d’appareils, « synthèse de la parole », et l’autre plus centré sur la langue, « La formalisation du lexique et de la phonologie en vue de l’application à la reconnaissance et à la synthèse de la parole ». Le premier comprend 29 communications et le second 10. La communauté est donc dominée largement par les « ingénieurs » et leurs objectifs (synthèse et reconnaissance de la parole) avec un apport des sciences humaines. D’une spécialité de sciences humaines en quête d’instrumentation pour comprendre un phénomène humain (la phonétique), on est passé à une spécialité hybride dominée par les sciences d’ingénieurs cherchant à créer des instruments susceptibles de se substituer aux humains ou de communiquer avec eux.
35Les instruments ont un rôle central dans cette histoire. Si Gsell se tourne vers les électroniciens, en interne comme en externe, c’est pour construire et mettre en œuvre des instruments qu’il juge nécessaires à l’essor d’une phonétique expérimentale finalement bien dans la lignée de Rousselot. Dans sa conception, les instruments sont au service de la recherche en phonétique dont les linguistes et les phonéticiens doivent rester les maîtres d’œuvre. Aux électroniciens de valoriser leurs travaux dans leur discipline.
36Mais les électroniciens ne se satisfont pas de ce rôle qu’ils considèrent comme subalterne. Ils entendent faire de la phonétique ou, en tout cas, participer à la définition des objectifs de la recherche sur la parole. Fant a produit une théorie acoustique de la parole, Boë se définit actuellement comme un spécialiste de parole, Carré a développé un modèle acoustique de production de la parole susceptible de se substituer à ceux des phonéticiens. Avec le déplacement terminologique de « phonétique » à « speech » en anglais et à « communication parlée » ou « parole » en français, un espace cognitif nouveau est ouvert. En 1967, tel qu’il apparaît dans le colloque du GALF, cet espace est dominé par les phonéticiens avec des apports des électroniciens et des physiologues. En 1970, il est redessiné et centré cette fois-ci sur les électroniciens avec des apports des phonéticiens. Les physiologues ont disparu, victimes de leur absence de relation avec les électroniciens.
37Dans les années suivantes, avec l’arrivée plus importante des informaticiens et l’implication technique et financière d’acteurs technologiques comme le CNET et IBM, la domination des « ingénieurs » se renforce en même temps que le statut des instruments évolue. La synthèse et la reconnaissance de la parole deviennent des objectifs en soi, dans le cadre plus général de l’étude des interactions Homme / Machine. Le développement des instruments (synthétiseurs, logiciels de reconnaissance vocale) devient alors l’objectif même des recherches et non plus un appoint à l’étude de la parole comme expression humaine ou acte physiologique.
38Le rôle des instruments dans la recherche est un des thèmes récurrents des études sur les sciences (Galison, 1987 par exemple). La « recherche instrumentale », c’est-à-dire l’activité de développement d’instruments pour la recherche a été étudiée de façon approfondie par Terry Shinn, qui définit plusieurs caractéristiques de ce type de recherche : la « généricité », c’est-à-dire la possibilité de transposer les instruments produits dans d’autres domaines que ceux dans lesquels ils ont été conçus, la position « intersticielle » de ceux qui la pratiquent, c’est-à-dire le fait que ces chercheurs se trouvent en marge des communautés établies et peuvent fréquemment changer de cadre institutionnel (de la recherche à l’industrie et réciproquement par exemple) en restant attachés à l’instrument qu’ils développent, et la « métrologie », c’est‑à‑dire la capacité des instruments à produire des mesures précises.
39Les électroniciens de notre histoire situent leur travail au début dans le cadre d’une recherche instrumentale (Shinn, 2000 ; Joerges & Shinn, 2001) et leur collaboration avec les phonéticiens et les linguistes s’établit sur la frontière séparant les sciences humaines des sciences d’ingénieurs. Mais avec la fondation du GFCP et le poids grandissant des objectifs proprement instrumentaux, ils parviennent à structurer une communauté stable, intégrant les sciences humaines dans une position dominée. On pourrait dire que leur position d’interface initiale s’est transformée en centralité dans la nouvelle communauté. À l’inverse, dans ce processus, les phonéticiens et les linguistes sont passés d’une position centrale dans les travaux sur la parole à un statut d’appoint au service d’objectifs qu’ils ne définissent plus. D’objet d’étude, les modèles du conduit vocal ou les connaissances sur la prononciation deviennent alors des outils au service du développement des techniques de synthèse et de reconnaissance. Ce renversement peut s’expliquer de différentes manières. On peut mettre en avant la forte « demande sociale » pour des instruments de codage, de synthèse ou de reconnaissance de la parole (avec les financements importants du CNET), le caractère contingent du retournement de 1968 dans la communauté française des chercheurs intéressés par ces questions ou encore les progrès de l’instrumentation avec l’arrivée des ordinateurs. Notre intention n’est pas ici de trancher entre ces explications, d’ailleurs compatibles entre elles. Elle est plutôt de souligner l’ambivalence de la dimension « instrumentale » de la recherche et la tension inhérente aux collaborations définies sur la base d’une division entre spécialistes d’un objet d’étude et spécialistes des instruments. Selon les rapports de force et les projets des uns et des autres, cette division peut s’inverser et l’objet central des recherches peut se déplacer de l’homme aux instruments eux‑mêmes.