- 1 Le présent texte constitue la version complète de l’étude déjà présentée dans le cadre de la rubriq (...)
1La conception des capsules vidéo produites pour des cours en ligne ouverts et massifs (MOOC) occupe, depuis quelques années, une place importante dans les préoccupations des enseignants, des chercheurs et des institutions engagées dans leur mise en œuvre. Pour aborder cette question, nous avons choisi d’adopter le double point de vue pédagogique et communicationnel évoqué récemment par Peraya (2017, §4) dans sa rubrique « Discussion-débat » consacrée aux capsules vidéo dans les MOOC1. Il nous semble en effet particulièrement intéressant de porter un regard qui prenne en compte d’autres dimensions que celles qui sont habituellement explorées dans les travaux qui leur sont consacrés, notamment la question de la durée et des choix de cadrage.
2Parmi les différentes composantes de ces cours en ligne — à savoir des ressources éducatives, une scénarisation et une communauté d'utilisateurs —, les capsules vidéo occupent une place tout à fait particulière. Elles constituent sur beaucoup de plateformes une part très importante, voire essentielle, des ressources mises à disposition des apprenants, à tel point qu'elles en sont quasiment devenues synonymes : un MOOC propose nécessairement une part importante de ses contenus sous forme de vidéos. Dans ce contexte, on peut se demander si les MOOC ne constituent pas, dans une certaine mesure, un nouvel avatar des films pédagogiques ou de la télévision éducative. Il nous paraît par conséquent pertinent d'envisager ces capsules vidéo en tant que dispositifs médiatiques et de nous appuyer sur des cadres d’analyse qui en découlent afin d'évaluer la manière dont ce média est mobilisé par ses concepteurs dans un but d'enseignement et d’apprentissage.
3Dans cette perspective, nous présenterons dans un premier temps la manière dont les questions pédagogiques et communicationnelles s’articulent autour d’un objet comme les capsules vidéo des MOOC. Ceci nous permettra de tracer les grandes lignes d’une grille d’analyse descriptive ayant pour but d’envisager la manière dont celles-ci construisent la relation au récepteur et le sollicite à des fins d’apprentissage. Dans un second temps, nous nous appuierons sur cette grille pour mettre en évidence différentes caractéristiques communicationnelles d’un échantillon de capsules vidéo de MOOC produit par l’Université de Genève. Notre analyse comportera deux volets ; un premier volet descriptif s’attachera à montrer la manière dont les capsules sélectionnées utilisent la vidéo pour construire un propos, structurer la relation à l’apprenant et sollicitent la mise en œuvre de processus cognitifs. Un second volet s’attachera à interpréter ces constats, de sorte à identifier les procédés qui semblent porteurs et leurs limites. Enfin, dans un dernier temps, sur la base de cette analyse, nous émettrons quelques suggestions destinées à encourager les concepteurs de capsules vidéo et de MOOC à développer ce que nous appellerons une « conscience communicationnelle », avant d’évoquer les pistes de recherche ouvertes par cette approche particulière.
- 2 Cet auteur a développé une sémiologie du cinéma considérant que le langage cinématographique est un (...)
4D’un point de vue communicationnel, les capsules vidéo à vocation pédagogique sont des dispositifs médiatiques complexes parce qu’elles articulent plusieurs registres sémiotiques (image animée, son, texte, etc.) de nature à structurer de manière spécifique la signification, la relation au récepteur et les processus cognitifs suscités. En effet, ce type de dispositif médiatique emprunte bon nombre de « codes » liés à ce que Metz (1971) appelait le langage cinématographique2. Pourtant, la littérature actuelle, nous l’évoquerons plus loin, ne rend pas vraiment compte de cette complexité. Comme le souligne Peraya (2017, § 32), « les instruments d’analyse, et les grilles utilisés dans ces recherches [NDLR : celles qui portent sur les capsules vidéo] ressemblent à un catalogue de quelques composantes de l’objet empirique dont le choix n’est guère argumenté et offrent de leur objet de recherche une vue extrêmement partielle et fragmentaire. ».
- 3 Les sciences de l’information et de la communication pour B. Campion et les sciences de l’éducation (...)
5Notre affiliation respective3, ainsi que plusieurs de nos travaux antérieurs relatifs aux dispositifs de formation et de communication médiatisées (Peltier, 2016 ; Peraya et Campion, 2008 notamment), ancrent notre vision de ces dispositifs médiatiques dans une double perspective : celles des sciences de l’éducation et des sciences de la communication. Nous considérons donc les capsules vidéo comme des dispositifs selon la définition initiale proposée par Peraya (1999), puis complétée par Peltier (2016). Cette définition envisage un dispositif comme :
- 4 Les éléments entre crochets représentent les ajouts proposés par Peltier, 2016, p. 15.
« Une instance, un lieu social d’interaction et de coopération possédant ses intentions, son fonctionnement matériel et symbolique enfin, ses modes d’interaction propres. L’économie d’un dispositif – son fonctionnement – [est notamment influencée par les intentions de son concepteur et s’appuie] sur l’organisation structurée de moyens matériels, technologiques, symboliques et relationnels [que les acteurs du dispositif s’approprient de façon différenciée et qui entraînent, en fonction de] leurs caractéristiques propres, [des effets] sur les comportements et les conduites sociales (affectives et relationnelles), cognitives, communicatives des [acteurs du dispositif].»4
- 5 Par exemple, interpeller directement le récepteur en lui donnant une instruction d'interprétation v (...)
6Dans cette perspective, nous avons identifié trois dimensions essentielles à prendre en compte dans la manière d’interroger ces capsules : discursive et sémiotique – ci-après identifiée comme « sémio-discursive » – (comment est construit le propos, sur les plans verbal et non verbal), pragmatique (comment est construite la relation au récepteur) et cognitive (quels sont les effets les plus probables de ces configurations langagières sur la construction des connaissances). La distinction de ces trois dimensions est nécessaire à des fins d’analyse, mais notons que dans les faits elles sont étroitement liées : la relation au récepteur est construite par les matériaux discursifs et sémiotiques, et la dimension cognitive peut être vue comme une conséquence directe des choix langagiers et relationnels. Concrètement, cela signifie qu’en tant que dispositifs, les capsules vidéo à vocation pédagogique articulent différents éléments langagiers (des métaphores, des mises en relation d'éléments par le montage, des interpellations, etc.) qui vont construire la relation au spectateur (Verón, 1986 ; Meunier et Peraya, 1993) et soutenir certains processus cognitifs comme ont pu le montrer différents travaux des années 1980 (sur ce point voir, par exemple, Lakoff et Johnson, 1980 ; Langacker, 1987)5. De plus, la position d’intermédiation occupée par ces dispositifs au sein d’une activité humaine va produire un certain nombre d’effets sur différentes dimensions du comportement humain tout à fait pertinentes à prendre en compte en situation d’apprentissage. Ces effets, ou médiations selon la terminologie propre au cadre conceptuel que nous mobilisons, peuvent concerner notamment les processus cognitifs (médiation sémiocognitive), la réflexivité (médiation réflexive), les intentions d’action (médiation posturale), les conditions de réalisation des actions (médiation praxéologique), la relation interpersonnelle (médiation relationnelle) (Peraya, 1993-2010 ; Peraya et Peltier, 2012).
7Ce choix conceptuel permet également de considérer « l’amont de la vie sociale des objets » (Appadurai, 1986, cité par Caron et Caronia, 2005, p. 51), c’est-à-dire ce qui constitue les prémices de l’usage et qui s’avère particulièrement intéressant pour en comprendre les modalités. À cet égard, le modèle de l’appropriation des dispositifs numériques proposé par Paquelin (2009) permet d’envisager tout dispositif médiatique dans ses différents états : l’état prescrit, l’état perçu, l’état prévu et l’état vécu. L’analyse que nous proposons se situe en amont de l’usage des capsules vidéo par les apprenants. C’est donc l’état prescrit, défini comme « le dispositif tel qu’il est conçu par les concepteurs et porteur d’une prescription ou d’une intention d’usage […] le dispositif matérialise l’intention préexistante qui lui a donné naissance […] » (Paquelin, ibid., p. 176) qui nous intéresse ici.
8Dans le milieu éducatif, les technologies (numériques ou non numériques) sont le plus souvent considérées comme des artefacts en dehors de leur usage. Or, de notre point de vue, un dispositif peut être considéré comme tel dès lors que celui ou celle qui en est à l’origine projette, même de façon idéelle (selon la terminologie proposée par Albero, 2010), l’usage qui va en être fait. De nombreux travaux, au carrefour des sciences de la communication et des sciences de l’éducation (Jacquinot, 1977/2012 ; Linard 1990 ; Peraya, 1999, 2010 notamment) et, plus largement, de la sociologie des usages (Latour, 2007 ; Blandin, 2002 ; Caron et Caronia, 2005), ont contribué à affirmer la non-neutralité des dispositifs médiatiques impliqués dans une activité d’apprentissage médiatisé. Plusieurs de ces travaux ont également souligné la nécessité de prendre en compte les spécificités sémiotiques des médias (les registres symboliques qui les composent), discursives (le type de discours qu’ils produisent), pragmatiques (le mode de relation qu’ils favorisent), etc. pour en comprendre les effets. On ne peut donc, lorsque l’on s’intéresse à la conception et aux usages pédagogiques de capsules vidéo comme composante d’un dispositif de formation médiatisée de type MOOC, faire l’impasse sur ces différents éléments. Les ignorer reviendrait à considérer que toutes les capsules vidéo se valent en matière d’apprentissage et que les modalités choisies (lieu de tournage – extérieur, intérieur, studio –, individu face caméra ou entrevue entre deux ou plusieurs personnes, décor, montage, etc.) n’entraînent pas d’effets particuliers sur celui qui les regarde.
- 6 Citons, par exemple, les travaux et recommandations de Guo, Kim et Rubin (2014) qui insistent sur l (...)
9L’examen de la littérature actuelle relative aux MOOC montre que l’une des principales préoccupations des concepteurs de capsules vidéo porte sur les meilleures façons de susciter et de maintenir l’attention de l’apprenant6 ou, en tout cas, d’assurer sa persistance au sein du dispositif de formation (Evans et Baker, 2016). Cela peut se comprendre aisément ; en effet, tout comme cela a été observé dans le cadre de la formation à distance, un fort taux d’abandon caractérise les MOOC. La littérature a mis en évidence la diversité des usages des MOOC et des buts poursuivis par les personnes qui s’y inscrivent (citons par exemple Glass, Shiokawa-Baklan et Saltarelli, 2016 ; Kizilcec et Schneider, 2015), tout en soulignant que le « butinage », c’est-à-dire le fait pour un apprenant de ne prendre dans un MOOC que ce qui l’intéresse sans le suivre dans son intégralité, fait aussi partie des usages possibles.
10Qu’il s’agisse de maintenir l’attention ou l’engagement de l’apprenant le temps d’une capsule vidéo ou d’un MOOC entier, il est un élément auquel les concepteurs de formation entièrement ou partiellement à distance sont particulièrement attentifs c’est la question de la présence. Plusieurs auteurs (Jacquinot, 1993 ; Peraya, 2014 ; Paquelin, 2014 ; Jézégou, 2007 et 2010) ont bien montré que la distance spatiale et temporelle qui caractérise ces dispositifs n’implique pas forcément une distance relationnelle. La présence – ou l’awareness selon la terminologie souvent employée pour désigner la circulation de signes de présence à distance – constitue une composante essentielle pour soutenir l’apprenant dans son parcours d’apprentissage et, par extension, son maintien dans le dispositif. Or pour soutenir l’engagement de l’apprenant, il est nécessaire d’établir une relation et de la maintenir dans le temps. D’où l’intérêt de s’appuyer sur des cadres communicationnels qui s’intéressent à la façon dont se structure, dans le discours filmique, la relation qui se joue entre l’énonciateur et l’énonciataire.
11Afin d’interroger le mode de relation et les processus cognitifs suscités par les formes discursives choisies dans le cadre des capsules vidéo que nous avons sélectionnées, nous formulons les questions de recherche suivantes :
Quelles caractéristiques discursives, sémiotiques et pragmatiques peut-on identifier dans les capsules vidéo à vocation pédagogique conçues par l’Université de Genève ?
Plus spécifiquement,
-
Sur les plans sémio-discursif et pragmatique, quel mode de relation les formes de discours identifiées soutiennent-elles ?
-
Quels sont les indices communicationnels permettant de nouer la relation et de la maintenir ?
-
Sur le plan sémio-discursif et cognitif, quels processus cognitifs les formes de discours identifiées encouragent-elles ?
12Nous avons mené une analyse d'un corpus de 19 capsules vidéo extraites de la quinzaine de MOOC produits par l’Université de Genève entre 2013 et 20167. Ces capsules ont été choisies par saturation en fonction de la diversité des situations discursives disponibles (face-caméra, entretien, discours à plusieurs voix) et de mise en scène (studio, intérieur, extérieur, décor signifiant ou non, etc.). L’objectif de cette analyse est de mettre au jour les caractéristiques récurrentes ou, au contraire, singulières de ces capsules vidéo de nature à nous indiquer la manière dont ce média est mobilisé par ses concepteurs pour susciter et soutenir l’apprentissage.
13Ce corpus a été analysé à l’aide d’une grille basée sur les outils de l’analyse sémio-pragmatique. Celle-ci, inspirée par Odin (2000), entend compléter l’approche sémiotique en envisageant les messages médiatiques, en particulier filmiques, du point de vue des effets sémiocognitifs et relationnels suscités par le dispositif médiatique chez le spectateur. Dans ce but, nous inspirant du « Guide pour l’analyse des messages médiatiques » proposé par Meunier et Peraya (1993/2010), nous avons identifié les éléments constitutifs des capsules permettant de cerner la construction de la relation avec le récepteur d’une part et le dispositif cognitif (au sens de Meunier et Peraya, ibid.), à savoir une combinaison langagière singulière impliquant le destinataire dans des opérations cognitives de différents niveaux, du plus empathique au plus réflexif, mis en place dans la vidéo d’autre part.
- 8 « Veuillez venir ici », par exemple, est un énoncé qui inclut (au moins symboliquement) le récepteu (...)
14Pour la dimension sémio-discursive, nous nous sommes principalement penchés sur les éléments typiques de l'écriture cinématographique (comme les plans, le montage ou encore la musique) documentés notamment par Odin (2000) ou Jacquinot (1977). Pour la dimension relationnelle, nous avons eu recours aux concepts d’embrayage (caractérisant la manière d’intégrer le récepteur du message au contexte d’énonciation8, voir Benveniste, 1966) et les éléments permettant de caractériser une telle relation lorsqu’elle existe (identification des interlocuteurs, actes de langage, position). Pour la dimension cognitive, enfin, nous nous sommes principalement attachés aux opérations sollicitées par les figures de style, les constructions narratives et la combinaison des différents éléments du dispositif audiovisuel. La grille d’analyse descriptive proposée ci-dessous récapitule les dimensions considérées.
15L’application de cette grille nous a permis de constituer un tableau descriptif systématique des différentes capsules vidéo du corpus sur la base duquel a été construite l’analyse. Notons toutefois que dans les pages qui suivent, nous ne retiendrons que les éléments issus de cette description et apparaissant comme significatifs dans les capsules vidéo du corpus. Certains éléments, que nous avions a priori évalués comme pertinents, n’ont, en effet, pas été pris en considération faute de matière suffisante dans le corpus. C’est, par exemple, le cas de la musique, inexistante en dehors du générique commun à toutes les capsules vidéo des MOOC de l’Université de Genève.
Tableau 1 : catégories d'analyse.
- 9 « La porte est fermée » est un énoncé constatif : les mots ne font que constater l'état du monde. « (...)
Critère d'observation
|
Mise en œuvre / analyse
|
Dimension(s) étudiée(s)
|
Embrayage : verbal / image
|
Observation de la cohérence et des ruptures entre verbal et image
|
Pragmatique
|
Actes de langage
|
Type d'acte, en particulier constatif (qui vise à conformer les mots à l'état du monde) ou performatif (qui vise à conformer le monde aux mots)9 (+ implications sur le positionnement des interlocuteurs)
|
Sémio-discursive et pragmatique
|
Récit : registre d'énonciation et construction narrative
|
Le cas échéant : structure du récit, personnages, nœud, dénouement éventuel
|
Sémio-discursive
|
Dispositif cognitif
|
Métaphores, métonymies, opérations sollicitées
|
Cognitive
|
Décor (signifiant ou non)
|
Ce décor est-il exploité et comment ?
|
Sémio-discursive et cognitive
|
Intervenants*
|
Nombre, qualité, rôle
|
Sémio-discursive, pragmatique et cognitive
|
Mise en scène
|
Notamment : disposition et déplacement des intervenants
|
Sémio-discursive, pragmatique et cognitive
|
Jeu de caméras et montage
|
Nombre, types de plans, type de montage
|
Sémio-discursive et cognitive
|
Musique*
|
Notamment : type de musique, en énonciation on ou off, etc. : c’est-à-dire produite ou non par ce qui est présenté à l'image, en lien direct ou non avec le propos
|
Sémio-discursive
|
Texte*
|
Intra ou extra-diégétique, c'est-à-dire interne au récit/monde représenté ou ajouté indépendamment de lui ? Assumé par qui ? Rapport avec la bande-image ?
|
Sémio-discursive, pragmatique et cognitive
|
En raison de la spécificité de l'approche sémio-pragmatique, qui envisage des configurations énonciatives, chaque élément observable veut renvoyer à une ou plusieurs dimensions étudiées. Les critères marqués d’un astérisque (*) n’ont pas été retenus dans l’analyse, faute d’occurrences suffisantes dans le corpus et dans le but de s’attarder plus particulièrement sur la dimension relationnelle et ses implications.
16Sur le plan sémio-discursif, d’abord, la plupart des capsules analysées se présentent comme de petits films à l’écriture cinématographique limitée. Ceux-ci articulent généralement une énonciation-récit (Benveniste, 1966, p. 253) sur le plan verbal et une énonciation-discours sur le plan visuel : le locuteur expose son discours de manière désembrayée, c’est-à-dire sans interpellation directe du destinataire, mais le fait principalement en face-caméra. La mise en scène est, la plupart du temps, limitée à la disposition de l’orateur dans un décor, avec une alternance dans les angles de caméra, vraisemblablement pour rythmer le déroulement du propos (généralement, alternance plan moyen/plan rapproché quand il y a un seul intervenant, champ/contrechamp quand il y en a deux). Certains amorcent un véritable récit, avec ses personnages et le nœud de son intrigue, sollicitant potentiellement les opérations cognitives spécifiques liées à la réception d’un récit (par exemple la segmentation et la structuration de l'expérience du monde, l'imputation de causalités entre événements, le séquencement et l'interprétation des comportements, l'élaboration de constructions socialement partagées basées sur des hypothèses communes ; voir Herman 2003). Toutefois, les récits au sens plein du terme sont très rares dans le corpus ; la plupart des exposés restant dans un registre de l’exposé, désembrayé verbalement, obéissant à d’autres modèles, comme l’exposé scientifique ou la leçon. Enfin, même si elles sont peu nombreuses (2 occurrences sur 19 vidéos), on notera la structuration de certaines séquences autour de métaphores conceptuelles ou visuelles, sur lesquelles nous reviendrons en envisageant leurs implications cognitives.
- 10 L’une, car elle ne met en scène qu’un dialogue entre deux protagonistes, l’autre parce qu’elle mont (...)
- 11 Citons, à titre d’illustration, cette séquence introductive proposée dans le MOOC « Calvin, histoir (...)
17Sur le plan relationnel, la construction des capsules établit un lien relativement paradoxal au récepteur. En effet, la grande majorité des extraits analysés (15 sur 19 ; seules 2 capsules ne comportent aucun embrayage visuel10) se caractérise par un dispositif très fortement embrayé sur le plan visuel, par une utilisation quasi continue du face-caméra simulant une posture de dialogue (axe Y-Y, « les yeux dans les yeux », pour reprendre l’expression de Verón, 1986). En revanche, ces séquences sont nettement moins embrayées sur le plan verbal. Si les bandes-annonces de MOOC ou encore les séquences introductives utilisent des marques de personne comme le « nous » (pour présenter l’équipe ou ses intentions) ou le « vous » (désignant les apprenants)11, celles-ci sont quasi totalement absentes des autres séquences. Ces dernières appartiennent plutôt, nous l’avons dit, au registre de l’énonciation-récit, comprenant très majoritairement des actes de langages constatifs (Recanati, 1981) : les intervenants décrivent le monde tel qu’il est, laissant le récepteur dans une position de spectateur extérieur à l’action. Dans certains cas, on note des plans ou des mouvements de caméra déconnectés du flux de parole, créant des ruptures dans la relation construite avec le récepteur, par exemple lorsque le contact visuel est rompu à l’un des rares moments où le récepteur est verbalement interpellé. C’est notamment le cas dans la séquence illustrée ci-dessous, où l’enseignant est filmé de dos alors qu’il tient les propos suivants : « Je suis professeur à l’Université de Genève, fondée par Calvin en 1559. Se sont joints à moi pour ce parcours plusieurs collaborateurs : [suit les noms des collègues qui ont participé au MOOC] ».
Illustration 1 : exemple de rupture visuelle lors d’une interpellation verbale.
18Sur le plan cognitif, enfin, nous notons que peu de vidéos exploitent véritablement ces choix sémio-discursifs et relationnels de manière à solliciter l’interprétation du récepteur. Se situant généralement dans un registre de description ou d’exposition du monde face à la caméra, les vidéos de notre corpus sollicitent très peu d’opérations complexes en dehors de celles nécessaires à la compréhension d’un discours généralement constatif et linéaire. Toutefois, on note quelques vidéos mettant en œuvre un dispositif cognitif construit pour amener le récepteur à effectuer des opérations mentales clairement définies, comme des comparaisons ou des inférences. Il peut parfois s’agir de dispositifs très simples, comme le montrent les vidéos structurées autour de métaphores. Ainsi, dans l’illustration 2 (ci-dessous), extraite d’un MOOC portant sur les exoplanètes, l’exposé est construit autour d’une métaphore visuelle : l’enseignant sollicite le récepteur en comparant la taille relative de différents fruits pour expliquer l’occultation provoquée par le passage d’une planète devant son étoile. On note que si un travail cognitif est nécessaire de la part du récepteur, celui-ci est limité (ou encadré) dans la mesure où celui-ci est soutenu verbalement par l’intervention de l’enseignant qui en donne la clé explicative : « To explain this [le transit des exoplanètes], I have to use my toolkit here. So my toolkit is made of, for example, by the pomelo that will represent the sun. So this is my sun and to find the equivalent of, for example Jupiter, I have to take a blackberry, so this is about the right size between the sun and Jupiter ».
Illustration 2 : exemple de recours à une métaphore visuelle.
- 12 Sans doute pour jouer sur les connotations associées aux cuisiniers et à la cuisine italiens, tous (...)
19Un autre dispositif employé pour susciter des opérations cognitives de la part du récepteur consiste à exploiter le cadre dans lequel est tournée la séance, que nous nommons ici « décor ». Celui-ci est, toutefois, utilisé de manières parfois assez différentes, notamment parce que son caractère signifiant pour le propos peut ou non être mis en avant par le dispositif. Dans le cas de décors explicitement mentionnés, on peut considérer qu'ils sont vus par les auteurs comme destinés à soutenir le processus cognitif des récepteurs. On note ainsi une mise en scène dans une cuisine pour illustrer le fait qu’un financier doit goûter son produit avant de le proposer au client (voir illustration 3). Dans cet exemple, l’enseignant introduit son propos en jouant une petite saynète exploitant la dimension métaphorique de la règle financière « eat your own cooking ». Le décor a ici pour fonction d’expliciter la métaphore, et par conséquent de faciliter la projection cognitive. Celui-ci est d’autant plus exploité dans le dispositif qu’il ne se contente pas de rendre la métaphore explicite sur le plan visuel, mais il « héberge » également une brève mise en récit impliquant un protagoniste externe, le cuisinier, permettant à l’enseignant de partager son propos entre l’apprenant auquel il s’adresse et ce troisième personnage. La séquence commence par une interpellation des récepteurs, en face-caméra : « Hello there, I’m gonna show you now in this kitchen what we mean by “eat your own cooking”. It’s a famous rule in finance when you hire a manager. » Il poursuit ensuite en s’adressant (en italien12) au cuisinier qui semblait jusqu’alors n’être qu’un élément du décor – au même titre que les objets caractérisant la cuisine – avant de revenir à un ton plus professoral à destination du récepteur, non sans avoir ostensiblement goûté la soupe dans la casserole qu’il manipulait.
Illustration 3 : exploitation du décor à des fins signifiantes (métaphore).
20De manière assez similaire, nous avons relevé une séquence d’un MOOC traitant des problèmes transfrontaliers, tournée sur le barrage régulant le flux d’eau entre la Suisse et la France (voir illustration 4) dans laquelle l’enseignante indique en préambule de son propos : « Nous nous situons ici à proximité du barrage du Seujet, qui est assez symbolique, car il encadre les relations entre la Suisse et la France, en aval, sur le bassin du Rhône. Le barrage du Seujet, c'est un ouvrage de régulation qui permet à la Suisse d'envoyer de l'eau vers la France. Dès lors, il est clair que la Suisse, en amont, peut être dans une position dominante à l'égard du pays aval. » Le décor joue ici un rôle non plus métaphorique, mais métonymique, de nature à soutenir un autre aspect de l’activité d’interprétation du récepteur. Celui-ci ne doit pas voir dans le décor une illustration redondante du propos verbal (comme c’est le cas avec la métaphore culinaire évoquée plus haut), mais peut au contraire y projeter des aspects de l’exposé de l’enseignante (par exemple, faire des inférences quant aux questions transfrontalières que peut entraîner la gestion d’un barrage dont les effets se font ressentir dans un autre pays).
Illustration 4 : exploitation du décor à des fins signifiantes (métonymie).
21Le décor est également le point de départ du récit dans l’exemple suivant (illustration 5), mais d’une manière différente. Il est exploité pour ancrer l’exposé dans un lieu emblématique en lien avec le propos tenu. L’enseignant introduit un cours d’histoire des religions en évoquant l’immolation d’un théologien du XVIe siècle sur les lieux mêmes de sa mise à mort : « Nous sommes ici à un endroit de Genève où Calvin, très probablement, n'a jamais mis les pieds. Si vous connaissez Genève, vous reconnaissez ce lieu, derrière l'hôpital cantonal, au pied de la colline de Champel. Si vous ne connaissez pas Genève, qu'il suffise de savoir que nous sommes à l'extérieur des remparts du XVIe siècle, à mille mètres environ du cœur de la ville. C'est ici que, le 27 octobre 1553, a été brûlé vif Michel Servet, médecin théologien espagnol, condamné par le Conseil de Genève comme hérétique. Pourquoi est-ce qu'on l'a condamné ? Je vais vous lire un extrait, de façon abrégée, de la sentence du Conseil de Genève. » Le récit ainsi initié est assumé comme tel : le récepteur est invité à envisager les faits relatés dans leur enchaînement et dans leur complexité au départ de la petite intrigue mise en place, dans lequel le décor assure le lien entre le passé et le présent. Toutefois, si ce décor est explicitement signifiant, on notera que son rôle de soutien aux opérations demandées au récepteur est indirect, voire secondaire : son extrapolation/interprétation par le récepteur n’aide pas, ou peu, à comprendre le récit et ce qu’il véhicule.
Illustration 5 : exploitation du décor à des fins signifiantes (ancrage du récit).
22Néanmoins, dans un certain nombre de cas, on note que des décors potentiellement signifiants ne sont pas exploités en tant que tels, limitant ou empêchant leur contribution au travail cognitif mené par le récepteur. Mentionnons, à titre d’exemple, une série de séquences tournées devant le Palais des Nations à Genève pour un MOOC consacré à la géopolitique. Dans la mesure où le lieu et sa signification ne sont pas mentionnés dans la capsule, le décor ne peut jouer de la même manière de point d’ancrage et de support à l’activité du récepteur (sauf dans l’hypothèse où ce dernier connaît et reconnaît le Palais des Nations dans l’image). Enfin, dans un certain nombre de cas, les décors semblent choisis pour leur fonction esthétique, jouant par exemple sur la profondeur de champ (du flou au net), éventuellement sans être identifiables : nombre de séquences sont ainsi tournées dans des jardins ou sur les bords du lac Léman, sans que le lieu ne soit mentionné ou que celui-ci ait un rapport explicite avec la thématique du MOOC. La dimension cognitive (généralement métonymique) de cette composition des séquences n’est pas mentionnée ou est laissée à l’appréciation du récepteur, et n’est dès lors pas en mesure de soutenir son travail cognitif.
23L’analyse que nous venons de mener permet de mettre en évidence les choix qui semblent caractériser la conception de ces capsules vidéo, dans le but de les questionner sous l'angle de l’apprentissage et de la communication médiatisés.
- 13 À titre illustratif, voici un extrait de l’une des séquences analysées (MOOC « Gestion et politique (...)
24Tout d'abord, nous pouvons constater dans notre corpus l’apparent paradoxe relatif de la construction relationnelle des messages. En effet, alors que la quasi-totalité des capsules est construite sur un embrayage visuel fort et quasi continu (le professeur mis en scène parlant face à la caméra), l'embrayage verbal est extrêmement réduit, comme si en dehors de l'adresse initiale, l'enseignant ne parlait « à personne »13. De notre point de vue, ce paradoxe n’en est peut-être pas un, mais pourrait plutôt être la manifestation d’une conception particulière ou d'une méconnaissance de ce que nous pourrions appeler « l’économie communicationnelle » de ces dispositifs, c’est-à-dire leurs spécificités langagières, la façon dont celles-ci s’organisent et produisent des effets, notamment sur le plan relationnel. Par ailleurs, l’association d’un embrayage visuel fort et d’un embrayage verbal faible ou inexistant suggère une vision des médias et des représentations visuelles que nous pourrions rapprocher de la vision « tuyau » documentée par Jacquinot (1977/2012, p. 20). Dans son analyse sémiologique du film à intention didactique, Jaquinot (ibid.) propose une gradation de l’exploitation de l’écriture filmique. Ainsi le « degré zéro » de l’écriture filmique renvoie-t-il, selon elle, à l’exploitation du cinéma ou de la télévision comme de simples « techniques d’enregistrement [… ] qui n’utilisent pas les configurations signifiantes ni dans ce qu’elles ont de spécifiquement cinématographique, ni dans ce qu’elles ont de spécifiquement didactique puisque la visée didactique ‘préexiste’ en quelque sorte au travail d’enregistrement et n’est pas ‘effectuée’ par le film » (p. 131). Dans le média « tuyau », l’écriture médiatique n’est pas pensée pour soutenir les processus cognitifs, comme si l’image, représentant un événement existant par ailleurs, se suffisait à elle-même. Dans cette perspective, aucune intervention supplémentaire, comme une intervention verbale, n’est nécessaire pour soutenir le processus de communication et la relation pédagogique qui en découle. Nous postulons que l’absence d’embrayage verbal pourrait être révélatrice d’une telle vision.
- 14 C'est-à-dire où le récepteur serait explicitement désigné comme allocutaire inclus —au moins symbol (...)
25Ensuite, nous avons vu que les séquences analysées se caractérisent avant tout par des énoncés décontextualisés du contexte d'énonciation, présentant le monde indépendamment du récepteur. Celui-ci est, en effet, très peu sollicité en tant qu'interlocuteur14 ou, en dehors des quelques exemples de dispositifs cognitifs relevés ci-dessus, en tant que sujet pensant capable de mener des opérations d'interprétation sur la base de ce qui lui est présenté. Les éléments nécessitant un traitement cognitif plus poussé sont très peu nombreux, et le récepteur n'est pas sollicité en ce sens. Aucune consigne ne lui est donnée, il ne lui est pas demandé de procéder à des comparaisons ou à une réflexion. Le professeur expose, mais ne s’adresse pas (ou peu) directement à l’étudiant désigné en tant que tel. Il ne lui adresse pas (ou peu) la parole par le truchement de questions, de recommandations, de consignes. Le destinataire est très majoritairement construit par le dispositif audiovisuel comme un récepteur « passif », supposé écouter et apprendre. La récurrence d’actes de langage constatifs interroge, selon nous, la posture de l’enseignant vis-à-vis de l’enseignement et de l’apprentissage et, par conséquent, celle dans laquelle il projette l’apprenant.
26Cette absence de sollicitation des récepteurs est encore plus perceptible si l’on compare ces capsules avec d'autres types de séquences vidéo qui ont un but éducatif, mais qui sont issues d'autres contextes. L'émission de vulgarisation scientifique francophone et destinée aux jeunes C'est pas sorcier constitue à cet égard un exemple particulièrement frappant. Dans les deux cas, l'essentiel du dispositif met en scène un ou plusieurs animateurs parlant en face-caméra à des récepteurs supposés apprendre quelque chose, mais alors que le locuteur ne parle « à personne » dans la plupart des capsules vidéo des MOOC que nous avons visionnées, l'animateur de télévision n'arrête pas au contraire de les solliciter dans le cadre de l'émission de vulgarisation, tantôt en lui posant des questions (« Que va-t-il se passer ? », « Pourquoi est-ce différent ? »), tantôt en donnant des instructions sur les actions immédiates à mener (« Regardez ! », « Observez ! », etc.), tantôt encore en réalisant des expériences que le spectateur est invité à interpréter. Là où la plupart des capsules vidéo de MOOC que nous avons analysées présentent sur le plan relationnel une sorte de disjonction entre la bande-image et la bande-son, le dispositif télévisuel les met en cohérence dans la création d'une relation forte.
27Enfin, à l’exception de quelques choix de mise en scène particuliers consistant à mettre en avant un lieu (par la focalisation sur une statue ou l’utilisation de plans mettant en valeur un décor), un concept (par l’utilisation de fruits métaphorisant le transit des planètes devant leur étoile) ou un raisonnement (par le recours à des schémas, ou par la mise en scène de mains écrivant une équation), ces capsules vidéo ne montrent que très peu de choses, ne donnent pour ainsi dire (presque) rien à observer, malgré la grande diversité des sujets traités. L'image est la quasi-totalité du temps occupée par le locuteur. Celui-ci est, à l'exception du cuisinier accompagnant le professeur dans la métaphore culinaire déjà évoquée, toujours un acteur académique : le professeur en charge du cours et ses assistants, éventuellement un chercheur expert de la question, tels que les étudiants pourraient les voir dans un dispositif d’enseignement présentiel classique. Par ailleurs, très peu d'objets (matériels ou conceptuels) sont convoqués à l'image.
28La question posée par ce triple constat est, dès lors, double. D'une part, il convient de se demander dans quelle mesure cette configuration ne serait pas, potentiellement, contre-productive : ne pas maintenir ce lien relationnel pourrait s'accompagner d'une posture passive du récepteur, peu propice à l'apprentissage. D'autre part, de manière plus nuancée, il convient de noter qu'un MOOC ne se limite généralement pas à une suite de capsules vidéo (même si celles-ci en constituent l’un des éléments essentiels), on peut interroger l'articulation de la vidéo avec les autres éléments constituant le MOOC en émettant l'hypothèse selon laquelle ce qui place le récepteur dans une position d'apprentissage plus actif tient aux éléments et consignes externes à la vidéo elle-même. Si cette hypothèse était vérifiée, on pourrait se demander si l'intégration des différents éléments du MOOC ne gagnerait pas à être beaucoup plus poussée, avec des renvois du paratexte à la vidéo, mais également l'inverse. Alors qu’elle semble peu questionnée dans la conception de nombre de capsules vidéo de MOOC, notre analyse souligne indirectement la nécessité d’une double scénarisation (de la production et de l’appropriation) évoquée par Peltier, Peraya, Grenon et Larose (2016) dans leur étude portant sur l’usage des cours enregistrés par des étudiants universitaires, afin de favoriser la construction des connaissances au départ de l’usage de la vidéo.
29Considérant que la place centrale attribuée dans les MOOC à la vidéo participe d'une volonté de s'affranchir de certaines des contraintes de l'enseignement « traditionnel » pour toucher un public plus large et plus diversifié socialement et géographiquement, nous pouvons émettre un certain nombre de suggestions issues des constats opérés à partir de notre corpus.
- 15 Il importe toutefois de préciser que notre corpus comprend 19 capsules vidéo, ce qui est loin de re (...)
30Tout d'abord, sur le plan cognitif, la vidéo pourrait être mise à profit pour ouvrir les horizons des étudiants en leur permettant d'être confrontés à des intervenants différents ou plus diversifiés. Nous l'avons vu, dans notre corpus, rares sont les séquences qui utilisent cette possibilité15. Parmi les quelques exemples de notre corpus mettant en scène des interlocuteurs ne faisant pas partie de l'équipe enseignante, à la seule exception du cuisinier dans la métaphore culinaire déjà évoquée, on ne trouve que des spécialistes académiques : professeurs, assistants, chercheurs ou docteurs, désignés tels. La vidéo pourrait être utilisée pour introduire dans le cours des paroles issues de la société civile, d'acteurs politiques ou industriels, de témoins, de contradicteurs, de « non-sachants », ou de tout autre acteur éventuellement pertinents en regard de la thématique traitée. Sans prétendre faire le tour de la question avec ces suggestions, un MOOC en droit pourrait donner la parole aux protagonistes de la machine juridique, en médecine à des malades, en sociologie à des acteurs sociaux, et ainsi de suite.
- 16 Il est néanmoins nécessaire de mentionner que le cadre lié aux droits d'auteurs peut rendre cette s (...)
- 17 Notons que faisant ce constat, nous ne disons pas qu’il s’agit nécessairement un mauvais choix : de (...)
- 18 Il importe de préciser ici que l’intégration de schémas animés ou de déploiement de mises en scène (...)
31De la même manière, nous avons souligné que les capsules analysées présentaient très peu d'objets. Or, la vidéo pourrait potentiellement être utilisée pour « sortir » l'étudiant de l'amphithéâtre, fût-il virtuel, et le mettre au contact d'objets matériels ou immatériels nécessaires à l'appréhension de la thématique. Ainsi des cours d'histoire pourraient-ils présenter des documents d’archives, des cours d'ingénierie faire visiter des machines, des cours d'astronomie « explorer » des modèles mis en images16, etc. L'exemple rencontré dans le corpus qui se rapproche le plus de cette dernière possibilité est l'utilisation de schémas en support de l'explication orale. Toutefois, on notera que les possibilités offertes par le média vidéo restent sous-employées. Par exemple, dans les rares cas où nous notons l'utilisation de schémas, ceux-ci sont présentés le plus sous leur forme « achevée » et non progressivement déployés au fur et à mesure de l'explication, comme cela aurait pu être envisageable17, par exemple sous la forme d’animations synchronisées avec le discours verbal.18
32Sur le plan relationnel, la vidéo est également susceptible de permettre la construction d'une relation spécifique avec l'apprenant, plus personnalisée (au moins en apparence) que celle qui peut se dérouler dans un cours présentiel en grand amphithéâtre. Mais l'analyse de notre corpus indique que les possibilités en la matière sont très largement sous-exploitées, voire négligées par les enseignants. Alors que le média permettrait de valoriser le one to one, c’est-à-dire un mode de communication d’individu à individu, on se trouve très majoritairement dans un modèle de la communication one to many : celui où un orateur omniscient expose les faits à un public indéterminé. La capsule vidéo fonctionne alors sur le modèle de l'amphithéâtre, même si le propos s’intègre éventuellement dans un décor différent. L’exploitation du potentiel relationnel offert par l’usage d’embrayages verbaux, en tant qu’indices communicationnels permettant d’établir une relation, nous paraît ainsi particulièrement intéressante pour créer le lien pédagogique, mais aussi pour le maintenir en vue de susciter ou de relancer l’engagement de l’apprenant. Concrètement, cela implique de veiller à interpeller régulièrement l’apprenant en l’impliquant dans le déroulement du propos par des marques d’adresse du type de celles que l’on peut trouver dans les émissions de vulgarisation scientifique auxquelles nous faisions référence précédemment. Ainsi l’interpellation directe des apprenants, pourrait-elle être couplée à une activité de lecture critique, de recul réflexif ou encore d’échanges avec les autres apprenants. Nous l’avons souligné, les capsules vidéo s’inscrivent dans un ensemble plus vaste, le dispositif MOOC, mais le fil rouge qui lie les capsules vidéo aux activités existantes (la plupart du temps des quiz formatifs, mais parfois aussi des lectures complémentaires) n’est autrement signalé que par la disposition spatiale verticale dans l’environnement numérique qui incite à avancer dans le MOOC de façon linéaire, du haut vers le bas. À cet égard, un lien plus explicite entre les différentes composantes du dispositif mériterait d’être fait comme nous l’avons souligné précédemment.
33Plus largement, cela pose la question de la posture de l’enseignant et de sa vision de ce qu’est enseigner et apprendre. La littérature a montré (notamment Biggs, 1987, mais aussi Entwistle, 1988) que susciter l’activité chez l’apprenant pouvait favoriser la mise en œuvre de stratégies d’apprentissage en profondeur. Dans cette perspective, nous ne pouvons qu’encourager les enseignants impliqués dans la mise en œuvre de MOOC à réfléchir à la possibilité de ne pas reproduire le modèle canonique du cours magistral, mais à tirer profit de cette expérience singulière pour prendre du recul sur leurs pratiques d’enseignement et envisager l’expérimentation d’une autre façon de l’aborder.
34Dans un ouvrage consacré aux rapports aux images qu’entretiennent les humains, Tisseron (1996/2003) décrit le cinéma plus comme une opportunité de créer un « rassemblement », « une communauté de participation émotive et éventuellement expressive entre ses spectateurs » (p. 85) que comme un simple agencement technique permettant la projection d’images animées. Dans cette perspective, la salle obscure constitue un élément essentiel et propre au dispositif cinématographique. On pourrait considérer qu’à certains égards, le média vidéo offre des possibilités similaires susceptibles de générer ce sentiment d’appartenance, voire d’immersion dans un dispositif plus global qu'est le MOOC. L’exploitation de tout ou partie des caractéristiques mentionnées dans notre étude, que ce soit sur le plan des embrayages visuels et verbaux, de l’exploitation de décors (naturels ou non), d’objets, de sons, etc. comme éléments signifiants susceptibles de faciliter l’inférence, mais aussi sur le plan discursif avec l’intégration de registres de discours particuliers comme celui de la narration, pourrait ainsi contribuer à susciter, voire à renforcer, l’engagement des apprenants dans les MOOC.
35L'analyse que nous avons menée a permis de mettre en évidence des caractéristiques saillantes et/ou récurrentes des capsules vidéo de MOOC rassemblées dans notre corpus. Celle-ci nous a permis de répondre aux questions posées, révélant des capsules construites sur l’articulation d’un discours désembrayé et d’une mise en image fortement embrayée, créant assez peu le contact avec le récepteur autrement que par l’accroche visuelle, et de ce fait sous-exploitant souvent les possibilités de sollicitation cognitive offertes par la vidéo.
- 19 Par exemple la législation sur les droits d'auteur qui limite la possibilité de présenter des docum (...)
36Cette approche permet d'articuler les formes langagières (au sens large) rencontrées dans les capsules et les effets sémio-discursifs, pragmatiques et cognitifs les plus probables, ceci nous ayant permis d'envisager les capsules vidéo en tant que dispositifs médiatiques. Toutefois, nous ne prétendons pas que cette approche seule permette d'épuiser les questions que posent les MOOC aux scientifiques et analystes de la communication. D'une part, et conformément à son objet, si la méthode permet une description fine des processus langagiers, elle laisse dans l'ombre les contextes médiatiques (si les vidéos sont une part essentielle des MOOC, elles n'en sont pas le seul élément) et institutionnels de leur production. Dans ce cadre, si nous pouvons formuler des hypothèses sur le mode de fonctionnement des capsules en tant que « produit fini », nous n'avons pas accès aux intentions initiales des acteurs ni aux contraintes (institutionnelles, disciplinaires, matérielles) dans lesquelles elles ont été produites et qui pourraient expliquer certains des choix de conception et de réalisation mis au jour19. D'autre part, cette approche, si elle nous renseigne sur les implications les plus probables des choix langagiers des concepteurs de ces capsules, ne donne pas de certitudes à ce sujet. En d'autres termes, elle doit nécessairement se voir complétée par des évaluations empiriques sur des échantillons d'étudiants bien réels dès lors que l'on cherche à évaluer finement les gains pédagogiques de tel ou tel choix de conception ou réalisation. Cette première étude réalisée sur la base d’un échantillon limité de capsules vidéo mériterait également d’être complétée par une analyse similaire d’autres échantillons émanant de plusieurs institutions afin d’identifier si les constats que nous avons faits présentent une similitude dans d’autres contextes.
37Le constat d’une exploitation limitée du potentiel offert par le média vidéo nous a amenés à émettre un certain nombre de suggestions qui relèvent de manière générale de ce que l’on appelle l’éducation aux médias. En 1997, Peraya et Rickenmann soulignaient déjà la nécessité de former les futurs enseignants du primaire et du secondaire aux problématiques suivantes : « les modes de présentation et de traitement des contenus à travers les supports textuels, iconiques et sonores ; le rapport entre le texte, les images et le son ; la communication par l’image et plus particulièrement les rapports entre médias et communication pédagogique ; enfin, l’éducation au langage des sons et des images ainsi qu’aux formes de représentations scientifiques » (p. 17). Nous ne pouvons qu’abonder dans ce sens et souligner que les enseignants universitaires gagneraient également à être formés à l’usage de cette forme de langage particulier qu’est le langage filmique afin d’en exploiter les différentes facettes et ne pas nous limiter à une bande-image stéréotypée (un locuteur présenté face caméra la plupart du temps), à une bande-son limitée à un flux verbal sur laquelle repose la quasi-totalité de l'apprentissage envisagé. Plus largement, la maîtrise des genres et des textes médiatiques par les équipes enseignantes nous apparaît comme étant un enjeu essentiel de formation.
38Enfin, en raison même de leur nature médiatique, la production des MOOC est un travail important généralement mené par les équipes enseignantes en relation directe avec les services dédiés au sein des universités. Dans ce contexte, les capsules vidéo et les choix communicationnels et techniques qui les structurent sont aussi le résultat de cette interaction. Il est donc indispensable que les services en charge de la production des MOOC au sein des universités jouent un rôle dans cette maîtrise du langage audiovisuel par les enseignants et chercheurs, d'une part en le maîtrisant parfaitement, d'autre part en accompagnant de manière constructive et proactive les équipes pédagogiques dans la réalisation de séquences signifiantes et maîtrisées.
39Sur le plan de la recherche, plusieurs perspectives pourraient être ouvertes dans cette direction, par exemple en implémentant des MOOC qui prendraient en compte les caractéristiques communicationnelles que nous avons mentionnées et en analysant ensuite l’impact de ces caractéristiques sur l’expérience d’apprentissage d’apprenants (leur perception de leur place et de leur rôle dans le dispositif, leur motivation à poursuivre leur apprentissage, les stratégies cognitives et métacognitives mise en œuvre, etc.).
40L’ensemble de la démarche dont nous venons de rendre compte s’inscrit dans l’approche « dispositive » évoquée récemment par Peraya (2017) dans le cadre d’une discussion-débat consacrée aux capsules vidéo dans les MOOC. Celle-ci nous a permis de montrer, si besoin était, la pertinence d’un retour à des cadres théoriques communicationnels pour certains déjà anciens et méconnus en sciences de l’éducation, mais qui conservent toute leur actualité et leur adéquation pour la conception et l’analyse des dispositifs médiatiques que sont les capsules vidéo à vocation pédagogique.