- 1 Luis Von Ahn a notamment participé à la création du protocole d’identification en ligne ReCAPTCHA e (...)
- 2 « De rapides avancées dans l’IA générative, en particulier les grands modèles de langage, vont chan (...)
1Tous les voyants sont au vert pour Duolingo, leader mondial du marché de l’apprentissage des langues en ligne. Fondée en 2011 par Luis Von Ahn, professeur en data science à l’université Carnegie Mellon et son doctorant Severin Hacker, l’entreprise a connu une croissance continue, ponctuée par une entrée en bourse à l’indice du Nasdaq en juillet 2021. Son application ludique était utilisée chaque mois par plus de 83 millions de personnes dans le monde au 30 septembre 2023 – une audience en hausse de 47 % sur un an (Duolingo, 2023c, p. 1). Dans son bilan financier de 2022, la firme a annoncé un chiffre d’affaires record, à près de 370 millions de dollars (Duolingo, 2023a, p. 68). Cependant, eu égard aux 17 milliards de dollars qu’aurait amassés l’ensemble du secteur en 2020 (HolonIQ, 2021), sa domination est loin d’être hégémonique. De fait, dans ce marché en pleine expansion, les barrières à l’entrée sont quasi-absentes – des milliers d’applications existeraient dans le monde. Les coûts de sortie sont presque indolores pour l’apprenant qui peut facilement quitter une application pour une autre. Sans leader à même de verrouiller sa base d’utilisateurs, la situation actuelle est donc celle d’une course aux parts de marché entre Duolingo, Babbel, Rosetta Stone, Mondly ou Busuu. Dans ce contexte, un axe de « disruption » privilégié par ces entreprises est l’intelligence artificielle (IA). Depuis ses débuts, Duolingo est engagé dans ce chantier scientifique et industriel où ses fondateurs ont jadis fait leurs armes1. La firme a développé des algorithmes appliquant à l’enseignement des langues les trois fonctions de l’IA selon Yann Le Cun : percevoir, raisonner et agir (Le Cun, 2019, p. 22). Des algorithmes de learning analytics visent premièrement à percevoir la progression de l’apprenant à partir de ses données. Cette quête d’une compréhension nouvelle de l’apprentissage conduit d’autres algorithmes à raisonner puis agir sur l’enseignement. Ces interventions peuvent prendre la forme d’une adaptation automatique de la pédagogie en fonction des besoins supposés des apprenants (adaptive learning), ou d’agents conversationnels répondant aux interrogations des élèves. Duolingo fait en définitive de l’IA la clé pour attirer et retenir les utilisateurs : « Rapid advances in generative AI, particularly large language models (LLMs), will change how people use technology to learn. We believe that this trend will continue to accelerate, and that it will offer an almost unimaginable set of opportunities for companies at the nexus of technology and education to teach at scale »2 (Duolingo, 2023a, p. 12). Toutefois ce chantier requiert des dépenses importantes, notamment pour recruter des ingénieurs qualifiés. De plus, les modèles prédictifs devant être entraînés sur des bases de données massives, les firmes doivent conjointement investir dans leurs « expériences-utilisateurs » afin d’attirer toujours plus d’internautes générant des données. De façon récursive, la base d’utilisateurs serait donc à la fois la condition du développement de l’IA et sa finalité commerciale, équivalente à la mainmise de l’entreprise sur le marché. Dans son Form S-1 – feuille de route publiée par toute entreprise devenant publique aux États-Unis – la firme présente aux investisseurs une « recette » pour relever ce défi pédagogique et marchand (Duolingo, 2021, pp. 112-113) :
- 3 Notre croissance et notre différenciation compétitive ont été permises par deux roues se mettant mu (...)
Our growth and competitive differentiation have been driven by two mutually-reinforcing flywheels: our learning flywheel and our investment flywheel.
– Learning flywheel: The greater the scale of our learner base, the more we can use insights from data analytics to improve both engagement and efficacy. The more engaging our products are, and the more effectively we teach, the more our learners tell their friends about Duolingo and the more we continue to grow our learner base.
– Investment flywheel: Our learner scale and word-of-mouth growth allow us to focus our capital investments on product innovation and data analytics, as opposed to brand or performance marketing. The more learners use Duolingo and convert into paid subscribers, the more we are able to invest in creating an even more delightful, engaging and effective learning experience. In turn, this increases our popularity and user scale, as well as the effectiveness of our data analytics, further widening our competitive moat3.
Figure 1. La stratégie de développement organique de Duolingo. En noir figure notre numérotation des étapes, suivant une chronologie arbitraire
2Dans ce récit, deux flywheels (que nous traduirons par « roues »), l’une pédagogique, l’autre financière, s’entraînent mutuellement vers une augmentation toujours plus forte de la base d’utilisateurs. Pour y parvenir, un moyen est mentionné de manière récurrente : l’accroissement du duo « efficacité-engagement ». Y réside le projet stratégique de développement de Duolingo tel que communiqué aux investisseurs : la fourniture d’une « expérience » toujours plus engageante et efficace, et attirant toujours plus d’apprenants – ce dont témoigne la flèche verte au centre du schéma. Pour y parvenir, deux moyens sont présentés : du côté de la learning flywheel, l’analyse des données ; du côté de l’investment flywheel, l’investissement dans celle-ci ainsi que dans l’« innovation produit ».
3Une première question mérite d’être posée à propos des significations de l’engagement et l’efficacité, laissés sans qualificatifs dans la description de ces roues. « Engagement » prend racine dans « gage », ce qui lui a valu dès le xiième siècle une acception juridique, en tant qu’« action de mettre (quelque chose) en gage », lier par un contrat, puis de se lier par une promesse », selon le Dictionnaire historique de la langue française (Rey et al., 2016). La circulation du terme au xxème siècle l’a amené vers le marketing, et au xxième siècle vers le web. L’engagement y est devenu un horizon à enjeux économiques très forts pour des sites et plateformes cherchant à « capter » l’attention de consommateurs soumis à une offre de contenus pléthorique – si bien que depuis plusieurs décennies « l’économie de l’attention » a souvent été annoncée à tort à travers comme le nouvel âge du capitalisme (Citton, 2014). Selon les contextes, l’engagement est drapé de vertus pour l’utilisateur. En éducation, Duolingo en fait l’indice de la qualité pédagogique de son application : il serait synonyme de l’assiduité de l’apprenant et de sa motivation à passer du temps dans l’outil pour progresser.
4Cette équivocité s’applique aussi à l’usage de l’« efficacité », qui peut être entendue dans un sens objectif, établissant la progression de l’apprenant suivant des standards pédagogiques reconnus. S’y superpose une acception plus subjective d’« efficacité » perçue par l’apprenant, de satisfaction qui découlerait de son engagement et que celui-ci devrait colporter auprès de son entourage, comme en témoigne le texte explicatif des flywheels : « the more effectively we teach, the more our learners tell their friends about Duolingo… ».
5Au-delà des promesses, quelle est la contribution pratique des algorithmes à ce projet, et en particulier à l’amélioration des deux métriques ? Participent-ils autant à la pédagogie qu’à la stratégie financière de Duolingo, ou promeuvent-ils une facette plutôt qu’une autre ?
- 4 En 1966, W.J. Baumol et W.G. Bowen avaient expliqué la hausse des coûts de production des théâtres (...)
6D’un point de vue économique, rappelons que l’éducation fait partie des secteurs culturels qui peinent à gagner en productivité et pâtissent de la maladie des coûts4 (Baumol, Bowen, 1966). Pour conquérir des gains de productivité, l’horizon historiquement privilégié est la substitution de la machine au professeur. Après des décennies de grandes promesses déçues par les défauts des outils informatiques, l’intelligence artificielle suscite à nouveaux frais des espoirs industriels. Dès lors, une lecture techno-centrée et au « premier degré » des flywheels ferait de cette technologie à la fois leur moteur et leur finalité, en tant que vecteur de « disruption » alliant qualité éducative et rentabilité. Toutefois la présence de ce schéma dans un document financier destiné aux investisseurs se prête à une seconde interprétation : celle d’une promesse faite aux investisseurs d’un placement rentable, censée conjurer la loi des coûts croissants. À partir de ce constat, une vision techno-sceptique ferait de l’IA un argument financier plus qu’éducatif, voire une nouvelle « poudre aux yeux » du monde financier, susceptible de constituer une bulle spéculative comme le fit internet au début du xxie siècle.
7Nous souhaitons dans cet article situer la visée stratégique de l’IA éducative de Duolingo, entre ces deux conceptions radicales, pour comprendre de quelle manière la firme investit ces technologies d’enjeux à la fois pédagogiques et économiques. En suivant la chronologie que nous avons apposée sur le schéma des flywheels, nous souhaitons déconstruire chaque inférence, en deux temps :
-
d’une part en explicitant la promesse pédagogique et économique qu’elle contient ;
-
en cernant d’autre part les manières dont les algorithmes contribuent à sa réalisation pratique. Les potentiels écarts observés entre ces implémentations et la profession de foi de l’entreprise pourront nous conduire à reformuler son projet stratégique de façon plus pragmatique.
8Notre démarche repose sur des analyses de ressources documentaires comme les articles d’ingénieurs disponibles sur le blog de la firme et les publications financières de l’entreprise. Nous nous appuyons également sur des analyses techno-sémiotiques de l’« expérience-utilisateur », tirée d’une observation participante menée depuis notre inscription sur l’application, pour apprendre l’espagnol, en août 2022.
9Le point de départ de ce récit est un postulat : le nombre d’utilisateurs augmentera nécessairement. Le paragraphe explicatif de la learning flywheel en tire la conséquence suivante : « The greater the scale of our learner base, the more we can use insights from data analytics to improve both engagement and efficacy ». Le lien de cause à effet entre l’accroissement de la base d’utilisateurs et celui des données récoltées est logique à première vue. Suivant la perspective éducative de cette roue, il devrait conduire à améliorer l’engagement de l’utilisateur dans son apprentissage ainsi que l’efficacité de la pédagogie. C’est la première fonction de l’IA identifiée par Yann Le Cun qui est en jeu dans cette inférence : l’analytique serait en mesure de percevoir l’apprentissage à partir des traces laissées par l’apprenant. Le projet se fonde sur la croyance, fondamentale pour l’analytique, dans l’équivalence entre la trace et la cognition. La donnée dans l’algorithme serait le reflet de l’apprentissage de l’utilisateur dans la réalité.
10La politique de confidentialité de la firme range les données en deux catégories (Duolingo, 2023b) : celles communiquées directement par l’utilisateur lors de l’inscription (données d’identification), et celles collectées automatiquement, qui nous intéressent ici. Ces dernières sont classées en trois sous-catégories : les données d’activité et d’apprentissage (censées informer la cognition de l’apprenant lors d’une session, comme les zones de clics, le taux de bonnes réponses, les erreurs commises), les données déclaratives (ses réponses à d’éventuelles enquêtes de satisfaction), et les données comportementales (clics et autres traces de navigation devant informer la performance du site et la pertinence du ciblage publicitaire). La diversité des données récoltées – au-delà de celles d’apprentissage stricto sensu – montre que Duolingo observe un large éventail de pratiques individuelles. Ce constat questionne d’ores et déjà le projet éducatif de la firme : les données comportementales sont-elles supposées jouer un rôle pédagogique, ne serait-ce que de manière indirecte ? Pour y répondre, tournons un peu plus la roue afin d’observer les « raisonnements » qu’opèrent les algorithmes d’analyse de données.
11Ce « réservoir » doit entraîner une meilleure compréhension, ou quantité d’aperçus (insights) de l’apprentissage individuel. Cette focalisation sur l’individu est informée par le collectif, via l’observation des régularités statistiques dans l’apprentissage quotidien de millions d’utilisateurs. La firme prétend ainsi que ses algorithmes d’analyse de données ont le pouvoir d’identifier les besoins pédagogiques propres à un utilisateur, afin qu’un parcours d’exercices ad hoc lui soit proposé. Entre en jeu la deuxième fonction de l’IA chez Yann Le Cun, raisonner, prenant ici le sens de prédire. Le modèle Half-Life Regression (HLR) estime ainsi la mémorisation d’un vocable chez un individu en termes de probabilité de bonnes réponses dans le temps (Figure 2.). Dans un article paru sur le blog de Duolingo, le directeur des recherches Burr Settles expliquait avoir perfectionné les recherches pionnières du psycholinguiste Hermann Ebbinghaus (Settles, 2016). En 1885, ce dernier proposait déjà une « courbe d’oubli » des mots d’un apprenant au fil du temps (Ebbinghaus, 1885). Un projet renouvelé par l’intelligence artificielle, à travers l’analyse automatique des erreurs de millions de personnes.
Figure 2. Courbe de mémorisation d’un apprenant concernant un mot
À partir de ses réponses dans le temps (vert pour une bonne réponse, rouge pour une mauvaise).
Settles, 2016.
12Une première limite apparaît dans ce projet de formalisation : les données traitées en amont (par exemple l’exactitude des réponses, les temps de réflexion, les espacements entre les sessions) reflètent uniquement des résultats obtenus en ligne par l’apprenant, sans prendre en compte des facteurs psychologiques, de stress ou d’inattention qui pourraient entraîner une erreur sans qu’il y ait pour autant oubli. La firme a tenté de répondre à cette limite avec l’algorithme Blame, visant à identifier la cause derrière l’erreur commise par un apprenant au sein d’une typologie de facteurs (un concept non maîtrisé en amont, une faute de frappe notamment). Sa finalité pratique est de rendre plus pertinente la sélection des exercices. Pour cela, Blame étiquette automatiquement chaque exercice avec les différentes compétences visées. À partir de ses données d’apprentissage ainsi que celles de millions d’autres utilisateurs, il donne la cause la plus probable ayant occasionné une erreur. Cette ambition explicative peut être atteinte quand une ou deux erreurs sont commises, mais devient une gageure quand la réponse accumule trop de fautes. Dans ces situations où le processus cognitif de l’individu est complexe, le système finit par abandonner, comme l’a reconnu Luis Von Ahn, le dirigeant de Duolingo (Protalinski, 2020). Ce risque, déjà identifié dans plusieurs travaux critiques en sciences humaines, découle du fait que les traces numériques demeurent des « traductions partielles et limitées des pratiques » (Ouakrat, Mésangeau, 2016). La tentative d’introduire de la nuance se heurte en amont à l’insuffisance sémantique des données d’apprentissage, quand bien même celles-ci seraient enrichies de traces comportementales ou contextuelles qui ne pourraient être exhaustives. Ensuite la recherche automatique de régularités statistiques dans ces jeux de données réduit le raisonnement pédagogique à une prédiction, quand l’enseignement fait aussi appel à la sensibilité et aux intuitions face à un éventail de facteurs hors ligne. Ces biais de perception et de raisonnement des algorithmes contrarient l’exigence de la personnalisation et menacent l’efficacité du processus pédagogique.
Figure 3. Division de la création de cours entre les humains et l’IA, selon le blog de Duolingo
Pajak, Bicknell, 2022.
13D’autres algorithmes doivent ensuite agir sur la pédagogie, au sens de la personnaliser. Sur le blog de Duolingo, les ingénieurs B.Pajak et K.Bicknell (2022) décrivent la personnalisation comme l’une des quatre étapes d’une division du travail de création entre humains et IA (Figure 3). Les deux premières, la conception du programme (« Curriculum design ») et la création de phrases types pour chaque compétence visée (« Raw content creation »), sont principalement assurées par des experts pédagogiques. L’IA prend davantage le relai au moment de créer, à partir d’une phrase type, plusieurs exercices possibles : texte à trous, reconnaissance d’extrait sonore… (« Exercise creation »). La dernière étape qui nous intéresse, celle de la personnalisation (« Lesson personalization »), revient à sélectionner le type d’exercice ayant la difficulté appropriée pour les aptitudes de l’apprenant. Elle est presque intégralement dévolue aux algorithmes.
14Parmi eux, Birdbrain assigne à chacun des exercices un indice de difficulté à partir des performances quotidiennes de millions d’utilisateurs. Il analyse ensuite les traces d’apprentissage passées de l’utilisateur – ce que les chercheurs en learning analytics nomment « le modèle de l’apprenant » – pour prédire ses chances d’y répondre correctement. Cet algorithme prédictif cherche en fait le type d’exercice où l’élève aura une probabilité de succès jugée optimale suivant la théorie de la « zone proximale de développement » (Freeman et al., 2023). Proposée par le pédagogue Lev Vygotsky, celle-ci stipule que la difficulté d’un exercice est adéquate lorsqu’elle n’est ni trop basse, ni trop élevée, mais suffisante pour que l’élève ait simplement besoin d’une aide extérieure pour le résoudre (Vygotsky, 1978).
- 5 La Figure 2. illustre ce principe : l’algorithme affiche le vocable d’autant plus régulièrement que (...)
15À l’intérieur de l’exercice, le modèle Half-Life Regression doit, après avoir modélisé l’oubli, permettre de personnaliser les mots affichés. Il obéit à un autre principe d’Ebbinghaus : la « répétition espacée ». Cette théorie vise à réafficher celui-ci de façon optimale pour sa mémorisation à long-terme, c’est-à-dire de manière espacée, à chaque optimum de la courbe d’oubli figurant le moment où l’apprenant serait sur le point de l’oublier. Dans le cas d’HLR, cet optimum se situe à la « moitié de durée de vie » (half-life) du mot dans la mémoire de l’individu, soit au moment où la probabilité de bonne réponse tombe à 50 %5.
- 6 « … tout ceci est combiné avec un désir de garder les apprenants motivés, en leur montrant un mélan (...)
16La personnalisation des exercices obéit également à un impératif de diversification des contenus : « …all of this is combined with a desire to keep learners motivated by showing them a mix of different exercise types, and a variety of sentences and language material »6 (Pajak et Bicknell, 2022).
17Les algorithmes sont alors censés être efficaces, au sens où l’entendent les concepteurs de Birdbrain (Bicknell et Brust, 2020) :
- 7 Les résultats des tests A/B mobilisant Birdbrain montrent que le recours aux informations de Birdbr (...)
The results of A/B tests using Birdbrain show that using information from Birdbrain to construct lessons at the right difficulty level for each learner has consistently helped our learners learn more (…) Using Birdbrain not only results in improved learning, but also improved engagement – learners are happier with their learning experience, and so they return to their lessons more regularly!7
- 8 « L’engagement est l’un des facteurs clés dans l’acquisition de compétences. Plus les apprenants in (...)
- 9 Cela rejoint, en France, la thèse du neuropsychologue Stanislas Dehaene, qui distingue quatre « pil (...)
- 10 La firme use fréquemment de ce terme inspiré de l’user experience (« expérience-utilisateur »), pou (...)
18L’efficacité est ainsi visée à travers la maximisation des interactions de l’utilisateur avec le produit, via des métriques comme la fréquence de connexion ou le nombre d’exercices terminés quotidiennement. Son acception principale est donc subjective, dérivant de l’engagement de l’apprenant. Ainsi celui-ci est-il le principal objectif opérationnel de la firme, justifiant que des données d’apprentissage mais également des traces comportementales soient recueillies. Le livre blanc de Duolingo en fait d’ailleurs le quatrième pilier de sa méthode pédagogique, « Stay motivated » (« Rester motivé ») : « Engagement is one of the key factors that lead to skill development. The more learners interact with content, the more opportunities they have to learn »8 (Freeman et al., 2023, p. 6). Les quatre autres piliers – « Learn by doing » (« Apprendre en faisant »), « Learn in a personalized way » (« Apprendre de façon personnalisée »), « Focus on what matters » (« Se concentrer sur l’important »), « Feel the delight » (« Ressentir du plaisir ») – sont autant de corollaires de la quête d’engagement9. Celle-ci structure l’ensemble de la learning experience10 de Duolingo, et véhicule un processus d’industrialisation de l’éducation. Nous pouvons caractériser celui-ci via les trois marqueurs définis par Pierre Moeglin (2016). Le premier, la technologisation, qui signale des fonctionnalités techniques porteuses de manières de faire auprès du public, est assurée par l’ensemble des dispositifs de rétention et de mise en action des apprenants. Les algorithmes d’analyse et de personnalisation assurent cette mission en back-end. Sur l’interface, une grande variété de dispositifs prennent le relai :
-
- 11 Terme parfois traduit en « ludification », désignant « l’usage d’éléments de game design dans des c (...)
- 12 « Badges Levels/Leaderboards Achievements Points », littéralement « Badges, Niveaux/tableaux de bor (...)
La gamification11, inspirée du système BLAP12, joue sur des ressorts psychologiques de l’apprenant pour favoriser son retour fréquent. Par exemple des récompenses graduelles (points d’expérience, badges, trophées) sanctionnent les bonnes réponses de l’apprenant. La mise en compétition d’utilisateurs du monde entier, classés en ligues selon leurs points d’expérience, favorise chez eux un esprit de compétition et une quête de prestige (Figure 4). En parallèle, la comptabilisation des jours d’utilisation consécutifs est censée créer chez l’individu une discipline d’autant plus forte que sa série s’allonge.
-
Le fil d’activités, intégrant une diversité de formats, dont des podcasts et stories en plus des exercices usuels (Figure 5).
Figure 4. Message de félicitation pour avoir prolongé une série (streak)
19La rationalisation de l’éducation, deuxième marqueur indiquant la diffusion d’une rationalité « instrumentale » ou « en finalité » (Weber, 1963 [1919]) s’observe dans la quantification de l’apprentissage. Des normes de performance sont ainsi transmises à l’apprenant, à l’image des points d’expérience affichés régulièrement à l’écran et déterminant son classement, l’incitant « à se mettre en situation de self-service, à se faire [le coproducteur] de la formation qui [lui] est destinée et à veiller [lui-même] (…) à l’entretien et à l’accroissement de [son] efficacité productive » (Moeglin et al., 2016).
Figure 5. Visuel annonçant le passage à la nouvelle learning experience
https://blog.duolingo.com/new-duolingo-home-screen-design/.
- 13 En page d’accueil du site français (https://fr.duolingo.com/, consulté le 11 décembre 2023), sous l (...)
- 14 « …careful repetition of content with the right amount of variation enables learners to gradually p (...)
20Le troisième marqueur, l’idéologisation – « processus par lequel (…) des acteurs rationalisent la rationalité de leurs stratégies » (Moeglin, 2016, p. 45) – adopte des formes diverses selon les publics visés. Auprès du grand public, l’idéologisation prend les atours d’une pédagogie à la fois « fun », « sans effort », et « efficace »13. Auprès des pédagogues, une théorie neuroscientifique est avancée : « l’apprentissage implicite » (implicit statistical learning) (Freeman et al., 2023, p. 3). Celle-ci établit que le cerveau humain apprend par observation d’événements dans son environnement, le conduisant à en déduire lui-même des règles statistiques et opérer des prédictions de façon inconsciente. Appliquée à Duolingo, cette pédagogie doit permettre un apprentissage autonome de l’élève dans l’application14.
- 15 « Les méthodes qui réussissent toujours dans l’éducation organisée […] donnent à l’élève quelque ch (...)
- 16 On touche là à une critique traditionnellement adressée au behaviourisme skinnerien, du fait de sa (...)
21Au-delà des discours, quelle pédagogie est-elle instrumentée par la personnalisation de la learning experience de Duolingo ? Cette question recouvre deux interrogations. La première concerne le caractère éducatif de l’experience. On peut l’estimer à l’aune de l’« expérience » chez John Dewey, « liaison entre subir et agir, entre endurer l’impact du milieu et réorienter sa conduite en fonction du trouble (ou du doute) que fait naître cet impact » selon sa préfacière Joëlle Zask (Dewey, 2003, p. 17). La learning experience de Duolingo semble à première vue épouser cette conception. Premièrement l’environnement numérique est transformé par l’apprentissage-machine, du fait des données numériques collectées. Ensuite la transformation de l’apprenant obéit à la conception behaviouriste de l’apprentissage de B.F. Skinner, selon lequel « enseigner n’est rien d’autre (…) qu’arranger les conditions de l’apprentissage, de façon à le faciliter, à accélérer l’apparition de comportements qui, sans cela, ne seraient que lentement acquis, ou n’apparaîtraient jamais » (Skinner, 1969, p. 79, cité par Moeglin, 2016). De fait, l’agencement dans un parcours linéaire de contenus adaptés et diversifiés sert l’apparition chez l’apprenant de structures mentales (patterns) sur la langue étudiée. Sa mise en activité régulière via la gamification est aussi une déclinaison de la pédagogie active que John Dewey appelait de ses vœux15. Toutefois, pour le philosophe américain, la médiation est essentielle dans l’expérience, et notamment la présence du maître, pour diriger la pratique vers une éducation libératrice et éviter son enfermement dans l’immédiateté et la répétition (Dewey, 1968, p. 116). Dans Duolingo, le fonctionnement statistique des algorithmes (témoin la répétition espacée), le système de récompenses et le formatage de contenus très courts favorisent plutôt chez l’individu une motivation « extrinsèque », liées à la perspective de récompenses extérieures16. On est loin d’une expérience où l’élève endosserait de son propre chef une posture d’expérimentateur telle que la prônait Dewey.
- 17 « Where the brain’s instinct is often to give up when learning gets difficult, we design our apps t (...)
22La seconde interrogation concerne l’intérêt pédagogique de la personnalisation par les algorithmes. Ceux de Duolingo personnalisent l’affichage de vocables et la teneur des exercices affichés, selon des inputs/outputs statistiques. Néanmoins leur perspective est limitée par trois angles morts principaux. Le premier, on l’a vu, est la psychologie de l’apprenant, que les algorithmes de Duolingo ne peuvent solidement appréhender, au risque d’assigner des leçons inadéquates, ce qui les empêche de dépasser la focalisation comportementale du behaviourisme. Les deux apories suivantes ont trait à des aspects pédagogiques laissés statiques : le programme et la méthode. Concernant le premier, l’apprenant qui maîtriserait déjà l’unité dans laquelle il a été affecté a la charge de conscientiser son besoin d’être surclassé, puis de se rendre à l’unité supérieure pour passer un test d’admission. Le dispositif ne peut identifier ce besoin et ré-agencer le programme par lui-même. Quant à la méthode, Duolingo conçoit tous ses contenus, aussi divers soient-ils, suivant un même cahier des charges : ceux-ci doivent être courts et ludiques pour diminuer l’effort perçu par l’utilisateur – impératif justifié par diverses assertions neuroscientifiques énoncées dans le livre blanc de la firme17. Pédagogiquement, cette méthodologie peut s’accorder avec l’acquisition de vocabulaire ou de bases grammaticales, et contribuer aux compétences réceptives (de compréhensions écrite et orale). En revanche la mise à l’épreuve de compétences productives (d’expressions écrite et orale) est pour le moins rudimentaire. Dans le cas de l’expression écrite, l’application demande à l’utilisateur de rédiger tout au plus une phrase, en tolérant, pour l’espagnol par exemple, des réponses non-accentuées. Exit des méthodologies plus exigeantes comme la rédaction de textes longs requérant la bonne graphie. Les algorithmes ne peuvent ainsi sélectionner, parmi une pluralité de méthodes, celles qui conviendraient le mieux à un apprenant pour maîtriser convenablement une langue. Le produit de Duolingo comme son livre blanc portent la marque d’une manière unique d’envisager l’utilisateur et, plus particulièrement, ses stratégies cognitives. En pâtit l’idéal initial de personnalisation pédagogique, de même que l’engagement sur le long terme d’utilisateurs qui auraient des ambitions plus poussées en termes d’apprentissage.
23« The more engaging our products are, and the more effectively we teach, the more our learners tell their friends about Duolingo and the more we continue to grow our learner base ». Selon cette formule accompagnant les flywheels, le duo « engagement-efficacité » est censé indiquer l’aptitude de l’entreprise à augmenter sa base d’utilisateurs. Dans la perspective pédagogique de cette roue, l’enjeu est d’accroître la quantité de traces sur les utilisateurs, pour lancer un nouveau cycle, plus puissant en termes d’analyse de données. Cela passe par deux objectifs préalables. Le premier est de fidéliser les utilisateurs déjà présents sur l’application. L’engagement est alors visé en tant que satisfaction de l’apprenant, consciente ou non, à travers les dispositifs vus jusqu’ici. Le second objectif est de recruter dans le vaste « réservoir » d’apprenants potentiels qui ne sont pas encore adeptes d’applications d’apprentissage, mais aussi à tirer parti des faibles coûts de sortie pour attirer les utilisateurs d’applications concurrentes. Le moyen privilégié est à nouveau la satisfaction, mais cette fois conscientisée et partagée par l’utilisateur auprès de son entourage.
24Deux présupposés présents en filigrane méritent d’être questionnés. D’abord, le premier objectif, qu’on peut qualifier de « rétention », infère la satisfaction de l’utilisateur à partir de son engagement. Cette inférence peut être abusive, comme l’illustre le recours à certains dispositifs issus du marketing. Les habitudes de connexion de l’usager sont ainsi traitées par un algorithme qui en déduit les moments les plus propices de la journée pour lui envoyer des invitations à se reconnecter. Cet outil contribue à son assiduité. Toutefois il est loin d’être évident de tenir pour satisfait un utilisateur. Peut-être, en effet, celui-ci se contente-t-il d’obéir à des mails invasifs dans l’espoir de conserver ses points d’expérience, mais sans adhérer véritablement à la démarche pédagogique proposée.
25D’autre part, l’objectif de recrutement infère une qualité de la learning experience telle que les apprenants se feraient les ambassadeurs de l’application. Pour favoriser le bouche-à-oreille, l’entreprise use cependant d’astuces identifiables à ce qu’Yves Jeanneret et Emmanuël Souchier ont nommé des « signes passeurs » (Souchier, Jeanneret, 1999). Par exemple, à chaque succès sur l’application (une bonne réponse, un défi relevé), un bouton de partage invite l’apprenant à colporter la bonne nouvelle sur les réseaux sociaux. La firme se plaît également à mettre en avant la contribution de son image de marque à sa croissance. Il est par exemple expliqué, dans le document d’introduction en bourse, peu avant les flywheels :
- 18 « Notre marque est devenue un élément de pop culture, apparaissant dans des memes internet et des s (...)
Our brand has become part of pop culture, appearing in internet memes and sketches on late night comedy shows. All of this has allowed us to grow our business organically, primarily relying on word-of-mouth virality rather than paid user acquisition18 (Duolingo, 2021, p. 3).
- 19 « Notre modèle freemium est le cœur de notre succès, car il permet un recrutement significatif d’ut (...)
26Néanmoins, la firme investit significativement dans des opérations publicitaires, sur les réseaux sociaux notamment. Les dépenses en « Sales and Marketing » se sont ainsi élevées à 67 M$ en 2022, soit 13 % de plus qu’en 2021, et un ratio de 18 % du chiffre d’affaires (Duolingo, 2023a, p. 68). Cette stratégie publicitaire est complétée par la distribution de l’application en freemium. La justifiant auprès du grand public par une volonté de démocratiser l’éducation, Duolingo offre une explication plus prosaïque auprès des investisseurs : « Our freemium business model is core to our success because it enables significant user scale »19 (Duolingo, 2021, p. 112). Sans barrière de paiement pour accéder à son service, la firme facilite ainsi la venue des curieux qui auraient été convaincus d’essayer l’application.
27Après avoir mis en évidence ces postulats à l’origine de la stratégie de Duolingo, revenons à la présentation que fait cette firme de sa « roue éducative ». La « disruption » pédagogique qu’est censé provoquer le recours aux algorithmes d’analyse et de personnalisation est illusoire. D’une part la proposition pédagogique de Duolingo reprend des théories quantitativistes éprouvées. D’autre part, sa seule nouveauté, l’analyse de données massives, pâtit d’angles morts qui restreignent la personnalisation. La fonction performative de cette communication financière est pour l’instant prédominante. La dernière inférence de cette roue est cependant celle qui doit enclencher la marche de la seconde roue, l’investment flywheel. Les dispositifs composant la learning experience sont alors investis de promesses financières auprès des investisseurs. Il convient de déconstruire ce second récit pour identifier les effets annoncés et les moyens alloués à leur réalisation.
28La première proposition de cette flywheel est d’induire, à partir d’un effectif croissant d’utilisateurs, une augmentation du nombre d’abonnés. Aux côtés de la formule gratuite et basique est proposée à ce jour une offre d’abonnement : Super Duolingo. Cette forme de monétisation joue un rôle crucial pour l’entreprise : comme indiqué dans ses résultats financiers de 2022, les abonnements représentaient sa première source de revenus avec 74 % du chiffre d’affaires, loin devant la publicité personnalisée sur la version gratuite, comptant pour environ 12 % (Duolingo, 2023a, p. 70). Le défi de la conversion est cependant difficile à relever, sachant que sur les 83,1 millions d’utilisateurs mensuellement actifs au 30 septembre 2023, seuls 5,8 millions étaient abonnés – soit un ratio d’environ 7 % (Duolingo, 2023b, p. 23). En cause, la forte volatilité des utilisateurs sur le marché des applications d’apprentissage des langues, étant donnés des coûts de sortie quasi nuls.
29L’engagement de l’utilisateur est donc surveillé par l’entreprise, cette fois pour ses retombées commerciales. Ainsi, sur la formule gratuite, il indiquerait la satisfaction des usagers quant à l’application, dont découle leur éventuelle propension à s’abonner, sinon leur rétention en tant que prospects pour des annonceurs. Pour maximiser la conversion, un second chantier consiste à rendre l’abonnement plus désirable que la formule gratuite aux yeux du grand public. On peut dénombrer trois principaux arguments d’appel :
-
l’absence de publicités.
-
la permanence d’avantages initialement vendus à l’acte, tels que les gemmes (la monnaie virtuelle de Duolingo, permettant de prolonger des streaks ou d’obtenir des essais temporairement illimités). Les ressorts psychologiques de la gamification (côté face, la quête de prestige social et côté pile, la frustration induite par le système monétaire) sont ici mobilisés à des fins commerciales.
-
enfin des technologies de personnalisation pédagogique supplémentaires. L’abonnement Super Duolingo propose, dans l’onglet Practice Hub, un algorithme reposant à l’apprenant les questions sur lesquelles il a commis des erreurs par le passé. Cette capitalisation sur l’IA a été poussée plus loin dans Duolingo Max, offre d’abonnement commercialisée aux États-Unis et au Royaume-Uni depuis mars 2023. Deux agents conversationnels, Explain My Answer et RolePlay, fournissent pour le premier des explications à l’utilisateur sur ses erreurs, et pour le second l’occasion de converser dans des situations variées. Ils ont été développés en partenariat avec l’éditeur OpenAI, à partir de son grand modèle de langage GPT-4. Or, comme on le sait, un important emballement médiatique s’est produit autour de ChatGPT depuis son lancement en 2022. L’on peut donc penser que, quelle que soit l’utilité pédagogique du recours à ce robot conversationnel, Duolingo cherche d’abord, peut-être surtout ici à faire parler d’elle. Du moins est-ce ce qui ressort de l’analyse des documents promotionnels accompagnant le lancement de l’abonnement sur les réseaux sociaux et le blog de Duolingo20.
30Les résultats financiers publiés par l’entreprise pour l’année 2022 valident cette stratégie commerciale. L’année fut faste pour l’entreprise, qui a réalisé un chiffre d’affaire record s’élevant à 369,5 M$ (en augmentation de 47 % par rapport à 2021). Comme l’explique la firme, le principal accélérateur fut l’augmentation des recettes d’abonnement qui se sont élevées à 273,5 M$, en hausse de 51 % par rapport à 2021. Le taux de conversion a quant à lui augmenté de 6,2 % en 2021 à 7,8 % en 2022 (Duolingo, 2023a, p. 70).
31La sixième proposition est une hausse des investissements découlant de l’augmentation du nombre d’abonnés. Auparavant, l’efficacité du produit, devant rendre chaque utilisateur ambassadeur de la marque, est censée avoir fait du branding et des campagnes de marketing des postes de dépenses secondaires derrière les investissements en recherche et développement, comme le prétend le texte explicatif de la roue : « Our learner scale and word-of-mouth growth allow us to focus our capital investments on product innovation and data analytics, as opposed to brand or performance marketing ».
- 21 En guise de comparaison, pour l’année fiscale 2021, Apple avait un ratio avoisinant 6 %, Amazon 12 (...)
32Lors de l’exercice 2022, les recettes ont effectivement été injectées en priorité dans la recherche et développement, à hauteur de 150,4 M$ – une somme en augmentation de 45 % par rapport à 2021 (Duolingo, 2023a, p. 68). Ces dépenses ont représenté 41 % du chiffre d’affaires – un ratio particulièrement important, même pour les standards traditionnellement élevés du secteur technologique21.
33Deux nuances s’imposent. D’une part, si la firme investit énormément dans sa recherche, elle investit également, mais indirectement, dans son produit. Ce sont les employee costs, – désignant la rétribution et l’intéressement des ingénieurs, designers et product managers – qui représentent la majeure partie de ces investissements. D’autre part, comme on l’a vu, Duolingo est loin de laisser de côté les dépenses en branding et marketing de performance. Celles-ci consistent à rétribuer les professionnels du marketing et financer les actions promotionnelles de la firme, nombreuses comme on l’a vu. Pour cause, elles représentaient 67 M$ en 2022, une somme en hausse de 13 % par rapport à 2021. Le rapport au chiffre d’affaires est de 18 % – certes bien inférieur aux 41 % du ratio de la R&D – mais loin d’être négligeable.
34Grâce à ces investissements Duolingo promet une amélioration du produit. Pour y parvenir, les ingénieurs et designers sont assistés par un second type d’algorithmes, non pas dévolus à la personnalisation de la pédagogie comme ceux vus jusqu’ici, mais au contrôle de l’efficacité d’une innovation avant sa généralisation. Sur le blog de Duolingo, une ingénieure du service d’expérimentation explique la méthode suivie (Aprameya, 2020) : à partir des projets d’expérimentation des ingénieurs, est automatisé un protocole de constitution des groupes « test » (par A/B Testing) parmi les millions d’utilisateurs de Duolingo dans le monde. Vient ensuite la phase d’analyse des résultats. Pour expliquer quels indicateurs priment dans la décision de généraliser ou non une fonctionnalité, l’ingénieure prend un exemple : le test d’une nouvelle annonce pour l’abonnement, apparaissant à chaque fois qu’un utilisateur de la version gratuite tentait de réaliser une leçon en étant hors ligne. Devant l’impossibilité d’accéder à l’exercice était alors soulignée la possibilité qu’ont les abonnés de télécharger les leçons pour des usages hors ligne. Si l’argument d’appel vers l’abonnement était opérant (le nombre d’abonnés a augmenté dans le groupe « test »), cette publicité aurait nui à l’engagement moyen dans la formule gratuite (le nombre d’usagers quotidiennement actifs aurait baissé). Dès lors, il aurait été décidé de faire de nouvelles itérations.
- 22 « Nous ne voulons jamais lancer de nouvelles fonctionnalités qui affectent négativement les habitud (...)
We never want to launch new features that negatively impact learning habits and behavior so even though this experiment was successful from a revenue standpoint, we decided to shut it down and iterate on it22 (Aprameya, 2020).
35Autrement dit, l’engagement des utilisateurs « gratuits » primerait sur la rentabilité à court-terme de l’entreprise.
- 23 Nous reprenons ce terme suivant l’acception proposée par Philippe Bouquillion, comme « développemen (...)
- 24 Deux mois après l’apparition de ce récit mécanique dans le Form S-1 de Duolingo, son principal conc (...)
36Ce récit trouve son origine dans le mode de financiarisation23 adopté par Duolingo, traditionnel chez les acteurs du web en phase de croissance : lever des fonds pour investir, souvent à perte, dans le perfectionnement de leurs produits, avec l’espoir final d’un « effet de réseau ». C’est-à-dire d’une masse critique de consommateurs qui rendrait leurs produits indispensable aux yeux des usagers, conduisant à leur domination sur le marché (Katz et Shapiro, 1985). « In turn, this increases our popularity and user scale, as well as the effectiveness of our data analytics, further widening our competitive moat » rappelle le texte accompagnant cette roue. La rhétorique des flywheels constitue à cet égard une « promesse techno-sémiotique » (Joly, 2011) à destination des marchés financiers. Il est intéressant de noter qu’elle fut aussi utilisée par Babbel, le principal concurrent de Duolingo, lors sa tentative d’introduction en bourse à l’automne 2021 (comme le montre la Figure 6)24. Dans ce récit, l’engagement serait la principale condition de la rentabilité à long terme, une fois que le marché serait mature, que la firme aurait verrouillé son monopole, et qu’elle serait en mesure de rentabiliser son activité. Dans cette logique, le désengagement des adeptes de la formule gratuite serait donc la hantise de ce type d’entreprise, ainsi que l’a montré l’exemple précédent.
Figure 6. La flywheel de Babbel
Babbel, 2021, p. 79.
- 25 L’EBITDA, ou « Earnings Before Interest, Taxes, Depreciation and Amortization », équivaut à l’Excéd (...)
- 26 « Nos coûts continuent d’augmenter, et plusieurs de nos investissements ont pour effet de réduire n (...)
37Opposer l’engagement des utilisateurs « gratuits » et la rentabilité à court-terme dans la stratégie de Duolingo serait pourtant une erreur. Cette dernière reste cruciale pour l’entreprise, et ce pour au moins trois raisons. Premièrement l’engagement dans la version gratuite est monétisé via des publicités personnalisées, représentant 12 % du chiffre d’affaires de Duolingo en 2022. Deuxièmement le schéma des flywheels vise aussi à convaincre que l’application génère organiquement des revenus, en quantité suffisante pour que la firme puisse s’autofinancer – par souci de crédibilité auprès des investisseurs. Ensuite la quête de rentabilité est d’autant plus pressante que l’investissement dans le produit, et en particulier dans l’intelligence artificielle, pèsent lourd dans les comptes de l’entreprise. L’EBITDA ajusté25 de Duolingo était notamment déficitaire de près d’1 M$ en 2021 (Duolingo, 2022). « Our costs are continuing to grow, and some of our investments have the effect of reducing our operating margin and profitability. If our investments are not successful, our business and financial performance could be harmed »26 (Duolingo, 2023a, p. 4). Étant donnés les risques d’« accident industriel », le danger se fait pressant pour l’entreprise, poussée à diversifier ses abonnements – avec Duolingo Max –, ou à investir d’autres marchés – comme celui de la certification en anglais depuis 2016. Malgré le récit d’une croissance organique et autonome de Duolingo, la firme est pour l’instant dépendante des apports de fonds extérieurs pour continuer à financer son modèle d’investissement.
38La convergence entre industries éducatives et culturelles est ancienne (Moeglin, 2004), mais accentuée par la « pression numérique », comme l’a montré Vincent Bullich dans son étude des plateformes de MOOCS. « Gageons, sans trop prendre de risque, que cette pression devrait s’accentuer à l’avenir, et que de nouveaux modèles d’organisation ne manqueront de s’adjoindre à celui des plateformes » concluait-il (Bullich, 2019). Faire de la learning experience gamifiée de Duolingo un nouveau modèle d’organisation est sans doute prématuré, et nécessiterait d’étudier en détail les stratégies de développement d’autres applications éducatives. Toutefois notre exposé a mis au jour quelques traits saillants d’un processus que nous avons qualifié d’industrialisation « par l’engagement ». Il peut constituer un modèle au sens de l’idéaltype weberien, comme « tableau de pensée homogène » a priori, auquel d’autres dispositifs pourraient être apparentés. Ses principales caractéristiques sont au nombre de trois :
-
L’éthos éducatif de l’engagement, assimilé à l’efficacité pédagogique. Le dispositif numérique, bricolage de dispositifs hétéroclites visant à maximiser cet indicateur, est idéologisé de façon à être reconnu comme un « média éducatif » (Moeglin, 2004).
-
La marchandisation du produit via deux modèles principaux (et complémentaires en cas de freemium) : l’abonnement et la publicité personnalisée dans une version gratuite.
L’engagement est alors utilisé comme un indicateur au service de ces deux modèles. Il doit informer la rétention des usagers « gratuits » comme prospects pour les annonceurs, leur propension à s’abonner et celle des abonnés à le rester.
-
La financiarisation. Le coût de cette course à l’industrialisation, en termes de recherche et développement mais également de marketing, rend les investissements extérieurs indispensables. Pour les attirer, les éditeurs formulent des « promesses socio-techniques » de rentabilité à court et long terme.
39Les algorithmes d’adaptive learning sont chargés d’œuvrer sur ces trois plans :
-
Ils doivent participer à l’engagement de l’apprenant en tant que composants du back-end personnalisant son parcours.
-
Ils doivent retenir sur l’application gratuite les apprenants/prospects et peuvent servir de produits d’appels vers l’abonnement ;
-
L’imaginaire « disruptif » qui les entoure est mobilisé dans les communications financières.
40La promesse d’une « disruption » du marché de l’apprentissage des langues en ligne, à partir de la fouille de données et de l’adaptive learning, est cependant exagérée. Cela est dû aux limitations de l’engagement en tant que métrique, tant sur les plans éducatifs que commerciaux. Du fait des limites sémantiques des données collectées, il manque des aspects subjectifs et psychologiques inhérents aux apprenants-consommateurs. Mobilisatrice, l’idéologie des flywheels doit cependant être dépassée afin de penser les conditions d’un service pédagogique désirable et pérenne pour le public comme pour les entreprises du secteur.