Navigation – Plan du site

AccueilNumérosVol. 65 - n° 4Les Cinq sens au travailLa production audiovisuelle au tr...

Les Cinq sens au travail

La production audiovisuelle au travail. Expertises et perceptions des techniciens dans la production de vidéos Sofar Sounds

Audiovisual production at work: Expertise and perceptions of technicians in the production of Sofar Sounds videos
Loïc Riom

Résumés

Les travaux qui s’intéressent aux contenus audiovisuels musicaux ignorent encore largement les pratiques de production. Pourtant, les quelques ethnographies qui ont décrit la prise de son ou le montage témoignent de la richesse de telles enquêtes. Ces travaux invitent à dépasser le caractère évident de contenus finis pour interroger les mondes professionnels mis au travail par la production audiovisuelle. Qu’est-ce qui constitue la particularité de ces activités ? Comment le son et les images sont-ils travaillés et, en retour, font-ils travailler ? De quelle manière la production d’un contenu audiovisuel façonne-t-elle ses qualités et sa réception ? Reprenant le projet d’une « sociologie de l’intermédiaire » d’Antoine Hennion, cet article s’intéresse autant à la façon dont les professionnel·les en charge de la production des vidéos musicales engagent leurs sens qu’à la façon dont ils et elles travaillent la perception de ces contenus. En examinant les différentes étapes de la production d’une vidéo chez Sofar Sounds, une entreprise proposant des concerts dans des lieux insolites, je décris la façon dont ces techniciens donnent une nouvelle présence à la performance musicale.

Haut de page

Notes de la rédaction

Premier manuscrit reçu le 31 août 2022 ; article accepté le 21 août 2023.

Notes de l’auteur

Des versions préliminaires de cet article ont été présentées au séminaire de l’Unité de sociologie visuelle de l’Université de Genève en 2020 et aux journées d’étude « Voir, entendre et monter la fête » à Lausanne en 2022. En plus des commentaires reçus lors de ces présentations, ce texte a grandement bénéficié des relectures de Solène Gouilhers et de Sylvette Riom. Je suis également reconnaissant aux trois évaluateurices de la revue pour leurs généreux commentaires ainsi qu’au comité de rédaction et aux coordinateurices de ce numéro pour leur accompagnement. Enfin, je remercie Bastien, David, Romain et les autres d’avoir accepté de prendre le temps de répondre à mes questions.

Texte intégral

1. Introduction

  • 1 Pour un panorama sur cette question voir Riom et Spanu, 2023.

1Généralement, les chercheuses et les chercheurs en sciences sociales considèrent les contenus audiovisuels musicaux — vidéoclips, captations de concert, émissions de variétés, télé-crochets — comme des objets à la fois évidents et finis. Dès lors, ils et elles s’appliquent avant tout à en analyser le contenu (Vernallis, 2004), à les resituer dans leur contexte de production (Straw, 1988) ou encore à en scruter la réception (Péquignot, 2018). Le travail de production — de la captation au montage — et les opérations qu’il nécessite sont très peu interrogées ou même décrites1. Cet article documente ces activités à partir de l’engagement des sens de celles et ceux dont le métier consiste à produire des contenus audiovisuels musicaux. Ce faisant, je vise à contribuer au renouvellement des modalités du dialogue entre sociologie de la culture et sociologie du travail. Pour ce faire, j’interroge la production audiovisuelle de deux façons : d’une part, je m’intéresse aux perceptions dans l’activité de production ; d’autre part, j’envisage la manière dont ce travail façonne les contenus audiovisuels.

  • 2 J’emprunte cette notion à Christian Bessy et Francis Chateauraynaud (2014 [1995]).
  • 3 Depuis les travaux pionniers d’Howard Becker, ce dialogue est déjà engagé, notamment dans cette rev (...)

2Dans la première section de l’article, je défends que la production de contenus culturels est un lieu privilégié pour saisir autant les sens au travail que le travail de production des sens. De ce point de vue, la question de « l’expertise sensorielle »2 peut contribuer à enrichir les discussions entre études de la production de la culture et analyse de l’activité3 et à prolonger le programme d’une « sociologie de l’intermédiaire » (Hennion, 1983). Du côté de la sociologie de la culture, l’analyse de l’activité permet d’envisager la production d’un contenu audiovisuel comme un problème pratique qui se pose aux acteurs et aux actrices. Ce travail appelle à la fois à développer une expertise spécifique et à coordonner une activité. Du côté de la sociologie du travail, la production de contenus culturels invite à suivre la façon dont les sens des professionnel·les sont engagés dans des chaînes d’activité complexes et à saisir de quelle manière ils façonnent le produit du travail.

  • 4 J’utilise ici et dans la suite de l’article uniquement le masculin pour désigner les techniciens de (...)

3Dans la suite de l’article, je décris la production de vidéos de concerts organisés par Sofar Sounds. Sofar Sounds est une entreprise qui propose des « concerts intimistes dans des espaces non-conventionnels » : bureaux, salons ou boutiques. Certaines de ces soirées sont filmées, puis un morceau par artiste est publié sur la chaîne YouTube de l’entreprise. Après avoir présenté l’enquête ethnographique que j’ai menée sur Sofar Sounds, je reviens sur quatre moments de la production de ces vidéos : la désintrication du son et des images lors du tournage (section 4) ; l’installation en studio comme une multiplication des prises sur les matériaux captés (section 5) ; l’indexation de ces matériaux au contexte de la vidéo (section 6) ; le soin déployé par les équipes techniques pour les manipuler (section 7). À travers ces différentes étapes, je montre de quelle manière les techniciens de Sofar Sounds élaborent pas à pas une nouvelle présence audiovisuelle de la performance sur YouTube4. Je souligne également que la perception des matériaux audiovisuels évolue tout au long de la production des vidéos. Je décris les différents dispositifs et expertises que ces formes variées d’attention engagent. Enfin, je défends que le travail perceptif donne à voir la précarité de l’activité, à la fois parce qu’il met le ou la professionnel·le à l’épreuve et parce qu’il contribue à l’expérience d’une organisation collective du travail.

2. Une sociologie de « l’intermédiaire » à partir des sens au travail

4Dans un article publié dans cette revue, Antoine Hennion (1983) appelait à une « sociologie de l’intermédiaire » au croisement de la sociologie de la culture et du travail. S’intéressant à la profession de directeur artistique au sein de l’industrie du disque, il plaidait pour saisir la production culturelle à partir de celles et ceux qui contribuent à lui donner une existence :

« L’intermédiaire n’est pas le fonctionnaire passif qui applique des lois (musicales, économiques, culturelles), il produit les mondes qu’il veut faire travailler pour lui. Il force, il arrache, il soude ; il a des outils et des techniques pour isoler, mesurer, essayer. Rien ne lui est acquis d’avance. Les lois ne s’ ” appliquent pas, les idées ne se réalisent pas : il faut d’abord le faire » (Hennion, 1983, p. 460).

  • 5 Si le travail d’Antoine Hennion a abondamment nourri les réflexions sur les amateurices et même sur (...)

5Alors que le dialogue entre sociologie de la culture et sociologie du travail s’organise généralement autour de notions comme celles de professionnalisation, d’espace professionnel ou d’autonomie (voir par exemple Menger, 2002 ; Lizé et al., 2011 ; Perrenoud, 2021 ; Picaud, 2021), ce programme permet toujours, quarante ans après sa publication, d’envisager d’autres modalités de discussion entre ces deux champs de recherche en mettant au centre de l’enquête l’activité des intermédiaires5.

  • 6 Ce point est encore peu relevé dans les travaux sur les intermédiaires. Par exemple, à de rares mai (...)

6De ce point de vue, la perception au travail peut contribuer à ce programme d’au moins deux manières. Pour commencer, poser la question des sens au sein des métiers de la culture permet d’opérer un « transfert attentionnel » (Denis et Pontille, 2022). En effet, pour ces professionnel·les, la perception engage bien souvent non seulement une interrogation sur ce qu’ils et elles sentent, mais aussi une anticipation de la perception de leur propre travail par les consommateurs et consommatrices finales. En d’autres termes, le public ainsi convoqué informe et guide leurs façons de percevoir6.

7Cette perspective transforme, toutefois, radicalement l’objet de l’analyse. Elle invite à suivre les contenus culturels comme des « œuvres en situation de travail » (Fourmentraux, 2010, p. 32). En effet, tant du point de vue d’une étude de la réception que des conditions de production des œuvres, les travaux partent généralement de l’idée que les contenus culturels sont des objets finis. Au contraire, prendre au sérieux le travail perceptif des intermédiaires amène résolument à adopter une perspective « émergentiste » (Camus, 2015, 2017) qui considère les produits culturels comme des objets en train de se faire (Hennion, 1993, 2018). Saisir les modalités de cette perception de la perception est un enjeu d’autant plus crucial qu’elle est décisive pour l’accomplissement de l’activité.

8Ce premier enjeu en amène un second. Envisager le travail sensoriel des professions de la culture conduit à dépasser une compréhension de la perception comme une activité qui se joue exclusivement dans le corps à corps avec l’objet. Depuis les travaux pionniers de Lena Jayyusi (1993) sur la caméra, différents auteurs et autrices ont souligné le caractère réflexif, interactionnel et corporel (embodied) des pratiques vidéographiques (Macbeth, 1999 ; Grimaud, 2007, 2015 ; Broth, 2008 ; Camus, 2021) mais également de la préparation des tournages (Grimaud, 2003 ; Rot, 2019). En ce qui concerne le studio d’enregistrement, à la suite d’Edward R. Kealy (1979), différents travaux ont insisté sur les techniques qui permettent de maîtriser les sons, de les transformer ou d’en changer la texture (Horning, 2004 ; Théberge, 2004 ; Ribac, 2007 ; Watson, 2014 ; Zimmermann, 2015 ; Bates, 2016 ; Rot, 2020 ; Battentier, 2021 ; Vinck et al., 2021). Toutefois, parce que produire un contenu culturel engage l’anticipation d’une réception, les travailleurs et travailleuses ne sont jamais que prises dans un face-à-face perceptif. Ils et elles accueillent dans leur perception l’ensemble de ce qui les sépare du public : distributeurs, dispositifs de diffusion, etc. (Hennion, 1983 ; Dubuisson et Hennion, 2013). Autrement dit, cette attention guide leurs choix et contribue à façonner les produits finis. Ce point est particulièrement bien souligné par les travaux qui se sont intéressés au goût dans l’industrie alimentaire, que ce soit pour le vin (Teil, 2001 ; Tabouret, 2021), les parfums (Muniesa et Trébuchet-Breitwiller, 2010), les tomates (Heuts et Mol, 2013) ou le jus d’orange (Callon et al., 2000).

9Les termes « produits » et « production » eux-mêmes expriment très clairement cette inscription des perceptions dans des chaînes d’actions complexes :

« La notion (producere : faire avancer) souligne qu’il [le produit] consiste en une séquence d’actions, en une succession d’opérations qui le transforment, le déplacent, le font passer de mains en mains, à travers une série de métamorphoses qui finissent par le mettre dans une forme jugée utile par un agent économique qui paye pour en bénéficier » (Callon et al., 2000, p. 216).

10La perception gagne donc à être appréhendée comme une activité distribuée dans des dispositifs, des collectifs professionnels ou des sites variés (Bidet et Boutet, 2007 ; Bidet, 2008 ; Boutet, 2008). À ce titre, Mylène Tanferri, Sarah Waeber et Dominique Vinck (Tanferri et al., 2023) montrent de quelle façon le montage vidéo consiste, en bonne partie, à composer avec le travail effectué par les collègues du monteur lors du tournage, afin de le poursuivre. Comme nous le verrons, suivre ce caractère distribué permet aussi de réintroduire, à partir de la perception, des enjeux relatifs à l’organisation et à l’expérience du travail (Bidet, 2010, 2011).

11De ce point de vue, les travaux sur l’expertise sensorielle peuvent enrichir de plusieurs manières la description de l’activité des intermédiaires culturels. Pour commencer, ces travaux soulignent que la perception fait appel à des équipements et des dispositifs. Si l’on prend l’exemple de l’antiquaire admirablement décrit par Christian Bessy et Francis Chateauraynaud (2014 [1995], p. 142-151), celui-ci s’appuie sur des catalogues, d’autres pièces, sa connaissance du marché, ses lectures, autant d’équipements cognitifs qui lui permettent de juger l’objet qu’il a en face de lui. Autrement dit, la perception ne se loge pas uniquement dans l’individu. Elle est distribuée dans un ensemble d’entités qui informent ses gestes et son jugement. C’est dans ce va-et-vient entre des « repères » et des « plis » que se réalise ce que C. Bessy et F. Chateauraynaud appellent la « prise ». Cette approche invite à comprendre la perception non comme la substance d’un monde existant et disponible, ni comme le résultat d’une culture ou d’une construction sociale, mais, au contraire, comme une minutieuse articulation de savoir-faire, de dispositifs, de corps et d’objets rendus sensibles et se laissant affecter par d’autres entités (Despret, 2004 ; Hennion et Teil, 2004).

  • 7 Dans un bref historique du terme, Gilles Delavaud (2010) note que la question de l’articulation ent (...)

12Ensuite, ces travaux montrent que la perception est ordonnancée à travers l’activité (Denis et Pontille, 2020a ; Grosjean et al., 2021). Ce qui est vu, senti ou entendu est abondement discuté, interrogé et testé par les acteurs présents (Goodwin, 1994). À la suite de Fernando Dominguez Rubio (2020, p. 8-9), je propose d’examiner les façons dont ces perceptions sont produites et maintenues en acte. À ce titre, nombre de pratiques artistiques, à l’instar de l’audiovisuel7, ont la particularité d’articuler différentes dimensions sensorielles. Par conséquent, saisir cette praxéologie de la perception requiert également d’examiner les façons dont ces articulations sont réalisées en pratique. « Voir », « toucher » ou « goûter » ne se résume jamais qu’à cela, mais appelle des formes d’engagements complexes et pluriels (Hennion, 2002, 2009). Comme le souligne Ingrid de Saint-Georges (2010, p. 189), percevoir « ne consiste pas à acquérir des connaissances sur l’activité, mais à construire des compétences dans l’activité ». Les différents gestes opérés éprouvent l’objet, permettent d’en faire l’expérience, mais mettent aussi le ou la professionnel·le à l’épreuve (Hennion, 2017). Le résultat du travail de production reste incertain. Comme le notent Emmanuel Grimaud (2003) à propos des films bollywoodiens ou Hervé Glevarec (1999) pour les émissions de radio, même les réalisateurices ne connaissent pas à l’avance le résultat final. Seul le travail de production permet de répondre à cette question.

13Dans la suite de cet article, après être revenu sur mon enquête auprès des techniciens de Sofar Sounds, je propose de reprendre l’une après l’autre les étapes de la production d’une vidéo pour saisir l’activité des intermédiaires à partir de leurs expertises sensorielles.

3. La production audiovisuelle chez Sofar Sounds

14Sofar Sounds est une entreprise qui organise des concerts « secrets » et « intimistes » dans des espaces « insolites ». Excédés par le bruit et le manque d’écoute dans les concerts qu’ils fréquentaient, ses fondateurs se sont donné pour mission de trouver une meilleure manière d’organiser des concerts afin de « rendre sa magie à la musique live » (un des slogans de Sofar Sounds). Ces soirées réunissent une soixantaine de personnes dans des espaces qui ne sont pas conçus pour accueillir des concerts : des appartements, mais également, et le plus souvent, des bureaux, des espaces de coworking, des magasins ou des cafés. Les soirées suivent généralement un même format : trois groupes se produisent, chacun pendant une vingtaine de minutes. Divers genres musicaux composent la programmation ainsi que du stand-up, de la poésie, ou encore du beat-box. Les prestations des artistes sont toujours « stripped back » (dénudées) : l’instrumentation est réduite et peu, voire pas amplifiée. Au cours de ces soirées, les spectateurs et spectatrices sont invitées à prêter davantage attention à la musique et à faire preuve de curiosité puisque le nom des artistes est tenu secret jusqu’au début de leur prestation (Riom, 2020, 2022).

  • 8 La production de soirées en « partenariat » est le deuxième modèle d’affaire de l’entreprise. Ces d (...)

15Fondée en 2009 à Londres, Sofar Sounds est présente dans 350 villes à travers le monde même si son activité reste principalement concentrée sur le Royaume-Uni et les États-Unis. Certaines de ses soirées sont filmées et les vidéos sont, ensuite, publiées sur la chaîne YouTube de l’entreprise. Sofar Sounds a commencé comme un réseau d’organisation de concerts dans des espaces privés comme il en existe plusieurs autres (Undertown, ConcertsInYourHome). Elle a ensuite connu un certain succès grâce à ses vidéos, dans un modèle proche d’autres séries de sessions live (Blogothèque, Balcony TV ou NPR Tiny Desk). Avec l’augmentation du nombre de soirées, Sofar Sounds se rapproche néanmoins de plus en plus d’un producteur de concerts à grande échelle. Les équipes de Londres ou de New York organisent, par exemple, près de soixante concerts par mois. La billetterie reste ainsi au centre du modèle d’affaires de l’entreprise et sa chaîne YouTube ne procure qu’un revenu accessoire. En revanche, les vidéos servent au marketing de l’entreprise, à attirer des artistes en quête d’exposition (Riom, 2023b) ainsi qu’à intéresser des marques pour leur vendre des soirées promotionnelles8.

16L’analyse présentée ici repose sur un travail ethnographique mené entre octobre 2017 et mars 2020 dans le cadre de ma thèse de doctorat (Riom, 2021). J’ai assisté à dix-huit soirées Sofar Sounds à Paris, Londres, Lausanne et Genève (soit environ 80 heures d’observation). Je me suis également entretenu avec des musiciens et des musiciennes, les équipes de Sofar Sounds (bénévoles et employé·es) ainsi que des spectateurs et des spectatrices (cinquante-neuf entretiens au total). Cet article se base plus particulièrement sur ma participation pendant deux ans comme bénévole aux activités d’une équipe locale. Après quelques mois passés à aider à la mise en place des soirées, j’ai commencé à comprendre que les vidéos étaient l’une des sources de motivation principales de l’équipe pour organiser des soirées — en particulier pour les techniciens —, et occupaient une part conséquente des discussions et du travail entre deux soirées. De plus, j’ai peu à peu saisi que l’organisation même des soirées était difficile à décrire sans prendre en compte cette activité qui, à première vue, peut paraître annexe. Échanger avec les techniciens et les interroger sur ce qu’ils faisaient m’a permis de développer un regard différent sur les soirées. Je leur ai demandé de pouvoir les suivre lors des étapes de production qui ont lieu après les soirées (mixage, montage, mise en ligne). En plus de ces observations, je m’appuie ici sur des entretiens menés avec une dizaine de techniciens, tant spécialisés dans le son que dans l’image, actifs dans les équipes de cinq villes différentes. J’ai complété ces entretiens en récoltant des directives internes de Sofar Sounds et des publications à propos des productions audiovisuelles sur le site Internet de l’entreprise.

  • 9 L’ensemble des noms des personnes interviewées sont des pseudonymes. L’entreprise, en revanche, n’e (...)

17Dans la suite de l’article, je fais du travail de Bastien — l’un des deux ingénieurs du son de l’équipe — et de Romain — le vidéaste — un support narratif pour déplier les enjeux propres à l’ensemble de la production audiovisuelle de Sofar Sounds9.

18Au moment de mon enquête, Bastien travaille comme technicien dans une institution d’éducation supérieure (il a depuis lors été engagé par une radio). Cela fait deux ans qu’il est membre de l’équipe après avoir été coopté par David — l’autre ingénieur du son — avec qui il a effectué sa formation dans une école privée spécialisée. Romain fait partie de l’équipe depuis presque trois ans. Après un brevet de technicien supérieur audiovisuel, il multiplie les projets pour se construire un portfolio (cadreur sur des tournages, technicien lors de retransmissions d’événements sportifs, réalisateur de clips). Tous deux ne sont que défrayés avec les donations récoltées au chapeau lors de chaque soirée (la somme qu’ils perçoivent varie entre 20 et 50 euros en fonction du succès de la collecte). Pour eux, contribuer à Sofar Sounds est avant tout le moyen de maintenir une activité créative en lien avec la musique. Celle-ci leur permet de prendre du plaisir tout en développant leurs compétences et leur réseau alors qu’ils débutent leur carrière professionnelle (tous deux ont alors entre 25 et 30 ans).

19En suivant les différentes étapes de la production d’une vidéo en particulier, celle de la performance d’Erika M, j’articule les gestes de Bastien et de Romain avec le reste des matériaux empiriques que j’ai récoltés au cours de mon enquête. Ce qui m’intéresse, ici, est de densifier mes observations en triangulant les matériaux empiriques de deux manières. D’une part, lors de la production de cette vidéo, je m’efforce de ne pas me tenir à une seule version du déroulé de l’action, mais d’y revenir de façon répétée et en multipliant les points de vue pour interroger « ce qui se passe » (Haeringer et Pecqueux, 2020). D’autre part, ce cas me permet de déplier l’épaisseur des gestes des deux techniciens en explorant les différentes ramifications de leur travail et leurs échos avec les récits de mes autres informateurs.

4. Désintriquer l’audio du visuel : deux dispositifs de captation pour un tournage

20La production des vidéos de Sofar Sounds commence en amont du travail de mixage et de montage, dès la mise en place des soirées. Par mise en place, j’entends toutes les opérations qui permettent aux équipes de Sofar Sounds d’investir un lieu — qui je le rappelle se veut inhabituel pour y jouer de la musique — et de le transformer pour qu’il soit en mesure d’accueillir des concerts. Cette étape marque déjà une distinction décisive dans la façon dont, respectivement, le son et l’image sont pris en charge et traités par une équipe dédiée. Dans cette section, nous verrons de quelle manière cette division claire du travail engage deux façons de percevoir la soirée.

21La soirée a lieu dans la pièce à vivre (salon et cuisine) d’un appartement en attique. Une fois Erika M et ses deux choristes installées Bastien commence, comme à son habitude, par placer les microphones qui lui permettront d’enregistrer la performance. Pour ce faire, il identifie les différentes sources sonores puis dispose un microphone devant chacune d’entre elles. Chaque microphone constitue une « piste » sur sa console de mixage. Généralement, une source compte pour un instrument ou une voix. Parfois, l’ingénieur du son double la captation afin de disposer de plusieurs enregistrements d’une même source. Chaque microphone possède une sensibilité spécifique en fonction de la qualité et de l’orientation de ses membranes. Ses caractéristiques le rendent plus ou moins approprié pour enregistrer certains types d’instruments plutôt que d’autres. Enfin, sur l’une des poutres de l’appartement, il ajoute un microphone omnidirectionnel pour capter l’ambiance de la pièce.

22Lors de cette mise en place, Bastien ne se contente pas de positionner les microphones. Il fait des allers-retours entre le milieu de la pièce et sa console de mixage pour écouter le rendu de la prise. Son écoute est bien différente de celle de l’auditeurice qui visionnera la vidéo sur YouTube. Elle n’est pas (encore) orientée vers le morceau, ni même vers la performance de l’artiste dans son ensemble, mais concentrée sur la « propreté » du son. Elle lui permet d’ajuster le positionnement des microphones dans la pièce et d’éviter les saturations.

  • 10 Susan Schmidt-Horning (2012) montre que le « close-miking » a été développé à mesure que l’espace (...)

23Les différents ingénieurs du son avec lesquels je me suis entretenu m’expliquent tous suivre le même principe : le close-miking (enregistrement de proximité). Cette technique a pour but d’enregistrer le plus près possible des sources sonores et, ainsi, d’éviter les effets de résonnance dus à l’acoustique de la pièce, ce qu’ils appellent la « room tone ». Selon leurs termes, cette technique garantit la « propreté » des enregistrements de deux manières. D’une part, elle permet de contourner l’acoustique parfois peu propice à l’enregistrement des lieux investis par les équipes de Sofar Sounds. Les ingénieurs du son cherchent ainsi à s’assurer des enregistrements plus facilement maniables et à éviter de devoir composer avec des effets acoustiques difficilement maîtrisables lors du mixage10. Il est arrivé que Bastien renonce au mixage de certains morceaux parce que les enregistrements étaient inutilisables pour cette raison. D’autre part, cette technique permet de garantir des « pistes » les plus distinctes les unes des autres. De cette manière, les ingénieurs peuvent balancer à leur guise le volume des différents instruments lors du mixage.

24De son côté, Romain prépare le matériel pour filmer la performance. Au moyen de deux projecteurs, il commence par éclairer la pièce d’une lumière blanche et homogène. Il m’explique que les caméras sont plus sensibles aux contrastes que l’œil humain. De cette manière, il évite les zones d’ombre qui risquent de créer des taches noires à l’image. Il positionne ensuite les trois caméras qu’il a à sa disposition. Comme me le précise Ertan, un des vidéastes que j’ai interviewés, ce nombre est défini dans les directives émises par Sofar Sounds. Il offre des plans suffisamment variés. Au fond de la pièce, la première caméra capturera un plan large statique sur les trois musiciennes ainsi que les premiers rangs du public. Au milieu du public, mais décalée de l’axe de la pièce, la deuxième caméra filmera un plan intermédiaire centré sur Erika M. Un cadreur venu renforcer l’équipe pour la soirée manipulera cette caméra. Romain, lui, opérera une troisième caméra, accroupi au premier rang. Il réalisera des plans serrés sur les gestes des musiciennes. Entre les morceaux, Romain et le cadreur filmeront également les différents protagonistes de la soirée. Ces images serviront de plans de coupe au montage.

25La notion de plan est ici importante. Comme celle de piste pour la captation du son, elle constitue l’unité de référence à travers laquelle Romain regarde la performance. C’est à partir de sa caméra qu’il voit ce qui va et ne va pas : un coin d’ombre, un instrument hors cadre, un objet incongru qui traîne à l’arrière-plan. Il passe derrière chaque caméra pour balancer les blancs et s’assurer de l’homogénéité des trois angles de vue. La variété de la composition des plans, leur luminosité, l’absence de zone d’ombre guident ses choix et définissent ce qui, pour les vidéastes, constitue un plan de qualité.

  • 11 Cette organisation ressemble à ce que l’on peut observer dans la retransmission d’événements en dir (...)
  • 12 WAV, pour Waveform Audio File Format, est un standard largement utilisé dans le domaine de la produ (...)

26Les microphones et les caméras désintriquent de manière durable la performance en deux matériaux parfaitement distincts11. À la fin de la soirée, Bastien rentrera chez lui avec des fichiers WAV enregistrés sur un disque dur, Romain avec des images au format MPEG-4 sur des cartes SD12. Chaque équipe utilise un dispositif technique propre. Celui-ci s’accompagne de compétences et de problématiques spécifiques (par exemple, éviter de capter le son d’ambiance ou s’assurer d’un éclairage homogène). Ingénieurs du son comme vidéastes perçoivent la performance à travers leur préoccupation à produire les meilleures « prises ». Bastien place des microphones qui permettent d’« entendre » des pistes distinctes les unes des autres en gommant l’acoustique de la pièce. Romain dispose des caméras qui « voient » des plans variés, mais de lumière homogène. Les termes de « prise » de son ou de vue reflètent bien ce travail : il s’agit d’un acte positif qui crée une unité nouvelle (Hennion, 1986). Dans les deux cas, l’agencement de différents équipements transforme une partie de ce qui se passe lors de la performance en matériaux que les techniciens pourront, ensuite, utiliser : des mouvements de l’air en signal sonore pour le premier, des nuances de lumière en images pour le second.

  • 13 Sur la façon dont la captation requiert une expertise pour gérer de l’espace, voir également Rot, 2 (...)

27Dans cette section, nous avons vu de quelle manière l’installation de leur dispositif de captation engage les perceptions des équipes techniques. Ce premier engagement inscrit — dans les matériaux captés, mais également dans leur travail — une manière d’« entendre » et de « voir » bien particulière13. Dans la section suivante, j’explore ce que les deux techniciens font de ces captations.

5. Le logiciel : un facteur de prises

28La suite du travail de production des vidéos poursuit cette division, à la fois, du travail et des matériaux du son et de l’image. Toutefois, l’intervention des deux techniciens ne sera plus simultanée, mais successive. La production débute par le mixage audio. J’insisterai davantage sur cette opération, car elle guide la suite de la production. Toutefois, cet ordre dans la temporalité du travail ne va pas de soi. Au cinéma par exemple, la production d’un film commence par le montage des images (Grimaud, 2003). Par ailleurs, ce ne sont pas toujours les mêmes personnes qui s’occupent des captations et du montage. Comme nous le verrons, ce hiatus a son importance et contribue au rapport des techniciens aux matériaux à leur disposition. Dans cette section, je décris de quelle façon les logiciels utilisés par Bastien et Romain organisent leurs perceptions des matériaux et leur permettent d’agir sur ceux-ci.

  • 14 Pro Tools se présente comme une « station audionumérique ». Il est l’un des logiciels de référence (...)

29Quelques jours après la soirée en question, je rends visite à Bastien chez lui. C’est dans sa chambre qu’il a installé son « home studio ». Si — en tout cas à première vue — son matériel s’éloigne de la représentation que je peux me faire des studios professionnels et de leurs interminables tables de mixage, je comprends rapidement que ce dispositif remplit à peu de chose près les mêmes fonctions. Comme dans beaucoup de studios professionnels, Bastien utilise le logiciel Pro Tools14. Celui-ci lui permet de simuler sur un ordinateur les différents composants qui équipent habituellement un studio d’enregistrement : table de mixage, compresseurs, effets, etc. L’ingénieur du son se met au travail tout en m’expliquant ce qu’il est en train de faire. Il prend le temps de répondre à mes questions et d’expliciter ses différents gestes. Quelques jours plus tard, Romain fera de même, mais cette fois chez moi : il n’a besoin de rien de plus que son ordinateur portable pour monter une vidéo.

  • 15 Sur ce point, voir aussi Bates, 2016 ; Camus, 2019.

30Au fil de la journée passée avec Bastien, je saisis peu à peu que ce home studio est avant tout une machine à engager les perceptions15. Je suis frappé par le fait que l’accès aux enregistrements de la soirée n’a rien d’évident. Avant que ceux-ci ne soient déployés dans le logiciel, j’ai de la peine à imaginer ce que Bastien sera capable d’en faire. Ils ne constituent que des captations très parcellaires du morceau — sur chaque piste on entend principalement un instrument désuni du reste de la musique — et sont ponctués de bruits peu identifiables qui brouillent la source. Je suis également surpris par l’incertitude qui semble habiter l’écoute de Bastien. S’il a ajusté les différents microphones en amont de la performance et a gardé un œil attentif sur sa table de mixage lors de l’enregistrement afin de s’assurer qu’il ne saturait pas, il concède n’être jamais à l’abri d’une (mauvaise) surprise. En parcourant les différentes pistes, il les redécouvre peu à peu : « ça sonne mieux que ce que je pensais ».

31Une fois importés dans le logiciel, les enregistrements gagnent en épaisseur. En plus du son diffusé dans les deux enceintes de part et d’autre de l’ordinateur, les différents signaux émis par le logiciel décomposent les enregistrements et en démultiplient l’écoute : des voyants lumineux indiquent la puissance du volume sonore, un minuteur donne le temps écoulé sur la piste, l’interface du logiciel permet de distinguer les différentes pistes. Pour mieux comprendre ce point, entrons davantage dans le détail du fonctionnement de Pro Tools. Sur l’écran de contrôle, chaque ligne correspond à une des pistes. Celles-ci sont représentées par leur « waveform », c’est-à-dire un graphique de l’intensité de leur signal sonore. La waveform renseigne les gestes de Bastien. Par exemple, lorsqu’il cherche le début d’une chanson, il parcourt la piste à la recherche des applaudissements qui s’intercalent entre les morceaux : « Tu vois ? Il y a des gros marqueurs ici [Il me montre la forme des ondes sur l’écran de son ordinateur]. Ça, c’est le public qui applaudit ». Il lance ensuite l’audio pour vérifier son observation.

32En observant Bastien, je comprends que l’engagement des perceptions de l’utilisateur ou de l’utilisatrice du logiciel va bien au-delà de ses seules oreilles. Par l’intermédiaire de l’écran et de la souris, le logiciel conditionne l’écoute et produit un rapport très particulier aux enregistrements. Grâce à la molette de sa souris, Bastien zoome et dézoome sur son écran pour parcourir les différentes pistes. En un clic, il en « mute » une (la rend silencieuse) ou la fait jouer « solo ». Je retrouve un dispositif relativement similaire avec Premier Pro, le logiciel de montage utilisé par Romain. Celui-ci simule le principe d’une régie de télévision. Comme Pro Tools, ce logiciel donne à Romain un large panel d’indications sur les images à sa disposition : un aperçu simultané des différents plans, des indicateurs sur leur luminosité, une timeline du montage. En d’autres termes, les logiciels donnent non seulement un accès, mais également un contrôle sur l’enregistrement.

33Comme le montrent Phillip Brooker et Wes Sharrock (2016), les logiciels organisent le travail et dessinent des capacités d’action. Ils sont des facteurs de prise : ils créent un contrôle sur les matériaux (Théberge, 1997 ; Thompson, 2004 ; Ribac, 2007 ; Bates, 2012 ; Zimmermann, 2015). Par leur médiation, les enregistrements deviennent malléables. Ici, un point décisif se joue : la qualité des captations se juge à l’aune de leur malléabilité vis-à-vis des opérations que les logiciels permettent d’entreprendre.

34Dans cette section, j’ai relevé qu’en « studio », face à leur ordinateur, Bastien et Romain se retrouvent dans une posture proche, même s’ils font appel à des savoir-faire et des problématiques propres à des champs de compétences distincts. Cette posture est bien différente de celle qu’ils adoptaient lors de la mise en place de la soirée : elle ne vise plus à évaluer la qualité d’une « prise », mais à prendre peu à peu prise sur les captations. Dans la section suivante, j’examine la manière dont le va-et-vient entre l’enregistrement et le « moment » de la soirée participe à l’instauration d’un morceau.

6. Indexer les matériaux : les difficiles allers-retours entre la soirée et son enregistrement

35Une fois les matériaux importés dans leurs logiciels respectifs, Bastien et Romain peuvent commencer le mixage et le montage à proprement parler. Dans cette section, je décris de quelle manière Bastien, puis Romain, reconstituent le lien entre les matériaux à leur disposition et la soirée. C’est à travers ce va-et-vient que les techniciens donnent une nouvelle forme à la performance des artistes. Ce passage s’effectue non seulement par un retour en arrière vers la performance, mais également par un saut en avant vers la réception à venir de la vidéo. Pour ce faire, ils composent une compréhension commune des qualités d’une vidéo Sofar Sounds qui guide leurs gestes et permet de coordonner leur travail.

  • 16 Une DI (pour direct input ou direct inject) est un dispositif utilisé pour éviter les pertes de sig (...)
  • 17 Avant la soirée, chaque artiste indique deux titres qu’il ou elle souhaite enregistrer (un premier (...)

36Bastien commence par nommer les pistes en spécifiant la source sonore et le type de microphone (par exemple, « Piano DI »16 ou « harmonies couple stéréo »). Il n’a pas d’images à sa disposition. L’enregistrement sonore, la waveform et ses souvenirs de la soirée sont les seuls appuis qu’il a à sa disposition. Ce travail d’indexation ressemble beaucoup à ce que les ethnométhodologues appellent l’indexicalité : un énoncé prend son sens en contexte (Garfinkel, 2009). Autrement dit, l’enjeu pour Bastien consiste à redonner aux enregistrements un contexte. Toutefois, le caractère problématique de cette indexation apparaît très clairement lorsque Bastien commence à délimiter le morceau qu’il va mixer. L’équipe ne produit qu’une vidéo par artiste, que celui-ci a choisie à l’avance17. Si l’équipe vidéo ne filme que les deux morceaux choisis, Bastien enregistre l’ensemble de la performance en continu : cette solution est plus simple que de devoir interrompre et reprendre l’enregistrement. Une fois le morceau identifié, il se met en quête de son « début » :

Bastien lance l’audio. Sur l’enregistrement, Erika M introduit le morceau : « this song is for everyone who has been dismissed ». Puis, il met la lecture en pause et s’explique :
« Il est où le début ? Généralement, j’aime bien garder quand l’artiste parle au début de la chanson. Il présente la chanson, j’aime bien. Et je sais que de temps en temps Romain l’utilise [pour le montage vidéo]. Et puis voilà, c’est fait pour ça Sofar. C’est des artistes qui expliquent leur musique, c’est important pour moi. Après, Romain l’utilise s’il veut ou pas ».
Il place alors une balise avec le titre à l’endroit qu’il vient d’identifier comme le début du morceau (avant la prise de parole d’Erika M).

37« Où est le début ? » Lorsqu’on visionne la vidéo sur YouTube, cette question semble aller de soi. Pourtant, comme le précise Bastien, l’enjeu n’est pas seulement de trouver les premières notes. La question l’amène à revenir sur ce qu’est Sofar Sounds : « des artistes qui expliquent leur musique », selon ses termes. Assurément, pour lui, les quelques mots d’Erika M pour introduire son morceau en font partie intégrante. À l’aide de balises (une pour le début, une autre pour la fin), il instaure une nouvelle entité : le morceau. Celui-ci est clairement identifié par un titre et délimité dans le temps.

38Cette opération produit une description décisive de la performance. Bastien aurait pu faire un choix différent, mais l’endroit où il place la balise n’est pas pour autant le fruit du hasard. Au contraire, il repose sur un effort pour (se) représenter la soirée, son atmosphère — notamment en termes d’intimité et d’attention à la musique —, les caractéristiques d’un concert Sofar Sounds, ainsi que la musique de l’artiste, son « son » et ses manières de jouer. La comparaison avec d’autres terrains permet d’approfondir ce point. Dans son travail de thèse sur la numérisation des archives du Montreux Jazz Festival, Alexandre Camus (2019) souligne des enjeux relativement similaires. Les employés·es du projet ont pour mission de délimiter des « songs » dans les enregistrements complets des concerts. Toutefois, au contraire de Bastien, ils et elles découpent les morceaux au plus près des premières notes, parce que ces morceaux devront s’enchaîner dans un logiciel qui propose des playlists (Camus, 2019, p. 122). Le découpage de Sofar Sounds vise, lui, à faire entendre l’ambiance d’une soirée type. De ce point de vue, le travail des techniciens et techniciennes ne peut être cantonné, comme le font Andy Battentier et Giselinde Kuipers (2020), à une question technique ou matérielle qui s’opposerait à un travail d’intermédiation culturelle ou esthétique. Ces choix contribuent activement aux qualités finales de la production.

39Le travail d’indexation n’a pas seulement pour enjeu de délimiter le morceau dans le temps. Les équipes techniques doivent rattacher l’enregistrement audio aux images. « Je sais que […] Romain l’utilise [pour le montage vidéo] », précise Bastien. C’est à partir de ces deux balises que le vidéaste travaillera en suivant la temporalité dessinée par la bande audio. Après avoir soigneusement désintriqué le son des images, les deux techniciens s’appliquent à réarticuler leurs captations respectives de la soirée. Cette opération peut s’avérer délicate. Parfois, Romain se retrouve sans les bonnes images. Dans le cas d’Erika M, il renoncera finalement à la phrase introductive de la chanteuse et coupera la piste audio jusqu’aux premières notes, parce qu’en raison d’un retard à l’allumage de deux des trois caméras, il ne dispose pas d’images de l’artiste en train de parler.

40Ce travail de réarticulation est caractéristique de l’audiovisuel (Bovet et al., 2014) : raccrocher ensemble, à travers un détour par le compte-rendu commun de l’objet de la vidéo, le son et les images. La crainte absolue est, d’ailleurs, celle d’un délai entre ces deux matériaux. Pour tisser ce lien, les techniciens font appel à des éléments qui caractérisent Sofar Sounds : « l’ambiance », l’unicité du lieu, l’attention du public, la proximité entre les « invités » et les artistes. Dans ce travail, ingénieurs du son comme vidéastes sont préoccupés par l’écoute du morceau une fois celui-ci disponible sur YouTube. La vidéo doit à la fois s’adresser à une personne, qui seule devant son écran doit pouvoir apprécier la musique de l’artiste, et témoigner à distance de l’expérience d’une soirée Sofar Sounds.

  • 18 Cette nouvelle propriété est réglée par le contrat signé avec les artistes, qui garantit à Sofar So (...)

41De ce point de vue, la production des vidéos fait passer à la performance une épreuve bien étrange en forme d’opération réflexive, au sens où elle produit une enquête sur ce qui est capté et ce que doit être l’objet audiovisuel produit. Bastien et Romain ont rarement besoin de coordonner leur travail. Ils s’appuient plutôt sur une compréhension mutuelle de ce qui caractérise une soirée Sofar Sounds. Cette compréhension est informellement discutée entre techniciens, et parfois avec les artistes, lors des soirées et de leur organisation. Elle est aussi informée par l’ensemble des vidéos déjà publiées sur la chaîne YouTube. Régulièrement au cours de mes observations, Bastien et Romain mobilisent d’autres exemples de vidéos pour m’expliquer leurs gestes ou leurs choix. Cette perception commune des qualités d’une vidéo est aussi en partie définie dans des directives internes et validée lors de la publication sur YouTube du produit final par la content manager de Sofar Sounds. À ce titre, une tâche importante de Romain consiste à habiller la vidéo de plusieurs « signes identificatoires » (Denis, 2001, p. 10) propres à l’entreprise (logo, police de caractères, animation). Ceux-ci permettent d’inscrire leur production dans la collection des vidéos disponibles sur la chaîne YouTube de Sofar Sounds. Ce point est important. Capter, c’est également s’emparer de quelque chose. À travers ce processus, la performance des artistes devient aussi un produit audiovisuel de Sofar Sounds18.

42Dans cette section, j’ai montré que l’indexation des matériaux permet de réarticuler le son et les images. Dans ces allers-retours entre la performance et YouTube, les équipes techniques appréhendent les matériaux disponibles à partir de ce qui définit, de leur point de vue, une soirée Sofar Sounds. Cette compréhension mutuelle instaure, à partir des vidéos en train d’être produites, une « mise en ordre sensorielle » (Grosjean et al., 2021) qui guide les techniciens. La section suivante s’arrête sur la façon dont Bastien et Romain manipulent les matériaux après les avoir indexés.

7. Faire avec : un soin de la manipulation

43Dans cette dernière section, je décris le soin que les techniciens portent aux matériaux qu’ils ont à leur disposition lorsqu’ils les manipulent. Dans cette attention se joue non seulement la qualité du produit audiovisuel final, mais également celle de leurs interventions. Les techniciens se trouvent alors face à la précarité de leur propre travail et des conditions avec lesquelles ils doivent composer.

44Maintenant que Bastien a délimité le morceau qu’il va mixer, il commence à travailler chaque piste de manière individuelle. Bastien renforce son engagement perceptif. Son écoute se transforme encore. Il parcourt les pistes à la recherche de « problèmes » : notamment, des saturations ou des bruits parasites. Bastien s’applique ensuite à les « réparer ». Il m’explique que ses interventions ne peuvent pas être trop brutales. Ce soin apparaît encore plus clairement lorsqu’il est confronté à un troisième type de « problème » : des sons qu’il identifie comme extérieurs à la performance.

« [En écoutant les pistes des choristes, Bastien réalise qu’elles rient pendant quelques instants] Mais pourquoi vous vous marrez ? Je vais faire un truc que personne ne va remarquer. [Il baisse le son de différentes pistes identifiées avec la voix des choristes pendant le temps des éclats de rire]
— Et pourquoi tu ne coupes pas simplement ?
— Si tu coupes, je vais te montrer [Il s’exécute et coupe la partie où les deux choristes rigolent].
— Tu as l’impression qu’elles entrent et qu’elles sortent de la pièce.
— Le truc, c’est que ça fait vraiment « hum, hum » [il imite le son coupé]. Tu vois ce que je veux dire ? Il y a quand même une ambiance derrière. Si tu fais de l’audio pour un film, tu appellerais ça de la room tone. C’est un truc dont tu n’as pas conscience que c’est là, mais ça l’est. Sur le court métrage sur lequel je suis en train de bosser, il y a un problème sur la room tone et tu l’entends. Le gars qui a pris le son l’a pris à différents niveaux et du coup tu l’entends. C’est réparable, mais difficilement ».

45Pour le dire autrement, Bastien est inquiet que cette absence — même silencieuse — soit décelée par l’auditeurice. J’observe le même soin chez Romain. Ce dernier préfère introduire un plan de coupe plutôt que de recarder un plan mal ajusté. Comme les effaceurs de graffitis qui veillent à ne pas laisser de « taches de propreté » après leurs interventions (Denis et Pontille, 2020b), ces manipulations appellent une attention renforcée tant aux enregistrements qu’aux techniques pour les éditer. Elles se rapprochent d’une nécessité de « faire avec », c’est-à-dire de composer avec la matière à disposition malgré ses résistances (Rosselin et al., 2015). Le soin que requièrent leurs interventions éprouve les deux techniciens : il met en jeu la qualité de leur travail et leurs compétences.

  • 19 Le mastering consiste à « imprimer » (selon les mots de Bastien) le mix sur une seule piste, afin (...)

46L’inquiétude de Bastien et de Romain porte non seulement sur leurs interventions, mais également sur les opérations qui les suivront, notamment celle de l’algorithme de compression de YouTube. Les deux techniciens savent que le produit de leur travail devra circuler sur cette plateforme en répondant à des standards bien particuliers. Par exemple, pour le volume, Bastien m’explique que si le signal est trop fort (supérieur à un niveau de -16 LUFS sur le long terme), YouTube applique une compression pour assurer l’homogénéité des contenus proposés. Or, cette compression risque de modifier les équilibres trouvés par Bastien lors du mixage. Il veille donc lors du mastering19 à ne pas dépasser ce seuil. De la même manière, une trop forte compression de la vidéo à cause de la taille du fichier risque de dégrader l’image en la pixellisant (s’il y a par exemple trop de nuances d’ombre).

  • 20 Le Museum of Modern Art de New York.

47Ce soin qu’apportent Bastien et Romain à la manipulation des fichiers son et image se rapproche de celui des conservateurs et des conservatrices du MoMA20, suivis par Fernando Dominguez Rubio (2020). Les professionnel·les du musée passent leur temps à délimiter ce qui relève de l’œuvre de ce qui n’en relève pas, tout en veillant à ce que leurs interventions restent invisibles. Fernando Dominguez Rubio utilise le terme de « mimographie » pour qualifier ce travail qui consiste à prolonger « l’intention » de l’artiste. Le travail de Bastien et de Romain y ressemble par plusieurs aspects. D’abord, ils ne peuvent s’affranchir des matériaux à disposition mais, au contraire, visent à les renforcer. Par exemple, lors du mixage de la performance d’Erika M, Bastien choisit de conserver le bruit d’une terrasse provenant de l’extérieur de l’appartement parce qu’il juge que cela fait partie de l’ambiance de la soirée. Ensuite, les deux techniciens veillent à garder une posture réaliste. C’est toute l’ambiguïté de leurs manipulations : elles doivent rester transparentes. Si Romain se permet d’utiliser des plans de coupe filmés lors d’autres morceaux et même parfois durant la performance d’autres artistes, il veille à la consistance de ces ajouts, en faisant par exemple attention à ce que les gestes du public suivent le même rythme que la musique. De la même manière, après avoir pris soin de gommer les effets de l’acoustique de la pièce, Bastien applique sur chaque piste une réverbération (une « réverbe », dit-il) cohérente avec la taille de la pièce où a lieu la performance. En cela, la production des vidéos s’écarte bien du travail de production d’un album pour lequel « la référence à une prestation musicale autre, en concert, s’évanouit au profit de la construction d’une nouvelle relation musicale spécifique : la production et l’écoute d’un nouveau produit (le disque), visé en tant que tel » (Hennion, 1986, p. 131).

48De plus, « faire avec » n’est pas uniquement l’enjeu d’une précarité face aux matériaux qu’ils manipulent. Cette précarité s’inscrit dans l’organisation du travail de Sofar Sounds. Bastien, comme Romain n’ont ni tout à fait les moyens, ni surtout le temps pour mener à bien ces tâches pour lesquelles ils sont uniquement dédommagés et pas proprement rémunérés. Comme me l’explique un technicien basé dans une autre ville, « [le travail] s’arrête là, parce qu’on n’a pas les moyens de passer des heures et des heures sur ces montages-là qui sont payés au lance-pierre ». C’est aussi avec ce cadre organisationnel — caractéristique de la production audiovisuelle où le temps de travail est souvent dicté par le nombre de jours de tournage ou de studio — qu’ils doivent composer. Ce cadre constitue l’expérience de leur travail. À plusieurs reprises au cours de mon enquête, Bastien et Romain m’ont fait part de moments de lassitude.

49En résumé, on constate que le travail des techniciens de Sofar Sounds consiste à « faire avec » les matériaux à disposition, plutôt qu’à créer un nouvel objet de toute pièce. Cette précaution appelle une attention fine aux matériaux, notamment permise par la médiation des logiciels. La difficulté est renforcée — par rapport au cinéma, par exemple — par le fait que la soirée n’est enregistrée qu’une seule fois. Toutefois, ce cadre confère également un caractère particulier au résultat ; comme le relève EclR — un rappeur interviewé —, il n’y a « pas des défauts, mais des petits bruits parasites, des petits trucs, je trouve que ça va avec la vie du moment, quoi ». Cette manière de rendre la musique présente prolonge l’aspect inédit, unique et éphémère que les artistes cherchent à donner à leur performance lorsqu’ils et elles se produisent dans une soirée Sofar Sounds (Riom, 2023a). Une fois en ligne, la vidéo donne au morceau une originalité nouvelle (Latour et Lowe, 2011), qui complète d’autres versions éventuellement disponibles en ligne : un clip, d’autres performances filmées ou simplement l’album.

8. Vers une sociologie de la captation audiovisuelle

50Dans cet article, en prolongeant le projet d’une « sociologie de l’intermédiaire » d’Antoine Hennion (1983), j’ai décrit la façon dont les sens des techniciens de Sofar Sounds sont mis au travail au cours des différentes opérations de production de vidéos destinées à être publiées sur YouTube. Nous avons vu qu’après avoir pris soin de désintriquer le son et les images, les techniciens s’appliquent à réarticuler ces deux types de matériaux en les indexant à leurs souvenirs de la soirée à travers un compte-rendu commun. Cette enquête engage la perception des techniciens bien au-delà de leurs seuls yeux ou leurs seules oreilles. Décrire finement leur activité permet de rendre compte de l’épaisseur de leur engagement sensoriel ainsi que de sa distribution dans des équipements — notamment des logiciels — et son inscription dans une organisation collective du travail. De plus, prendre au sérieux cette mise au travail des sens permet de montrer que le mixage et le montage ne sont pas uniquement des opérations techniques, mais façonnent les qualités des vidéos produites.

51Au moment où l’audiovisuel joue un rôle prépondérant dans les promesses d’un numérique plus immersif, il me semble important de relever au moins trois contributions de cet article. L’enjeu porte sur une compréhension plus approfondie de ces professions qui, souvent dans l’ombre, participent à façonner nos expériences sensibles et nos écosystèmes attentionnels (Citton, 2014 ; Auray, 2017). Premièrement, tout au long du processus de production, les façons de percevoir — d’écouter ou de voir, notamment — se transforment. Si, lors de la mise en place, les techniciens font avant tout attention aux qualités de la prise de son et de la prise d’image, le logiciel et les différentes opérations de la production — indexation, réparation — appellent d’autres manières de regarder et d’écouter. Ce résultat souligne la nécessité d’une attention non seulement à l’équipement des sens au travail, mais également aux modalités de la perception et à leur évolution au fil des étapes de l’activité. Il permet aussi de réaffirmer la pluralité des formes des engagements perceptifs (Coulter et Parsons, 1990) : il n’y a jamais une seule manière de voir ou d’écouter. Au contraire, c’est l’hétérogénéité des modalités de perception qu’il est intéressant de déplier. De ce point de vue, il n’est pas inutile de noter que l’intervention de dispositifs numériques n’annule ni n’automatise l’enjeu de la perception mais, au contraire, le déplace et le recompose (Bidet, 2008 ; Ribac, 2012 ; Rot et Vatin, 2016).

52Deuxièmement, j’ai souligné les liens entre les qualités des produits audiovisuels finis et les perceptions déployées par les professionnel·les. On peut ici rapidement récapituler les qualités principales des vidéos Sofar Sounds par comparaison avec d’autres contenus audiovisuels pour situer les savoirs perceptifs mobilisés dans leur production. Pour commencer, le son construit la narration (à l’inverse du film par exemple). Les images viennent l’illustrer, tout en exerçant une nécessité de cohérence. La manière dont les images et le son sont articulés se différencie sur ce point du clip où les images illustrent la musique sans obligatoirement passer par un compte-rendu de la performance. Ensuite, si la production des vidéos s’inscrit dans la continuité de la façon dont l’enregistrement moderne a été problématisé autour des notions de fidélité et de stéréophonie (Thompson, 1995 ; Clarke, 2005), elle s’en écarte aussi. Les techniciens de Sofar Sounds cherchent à capter un « moment ». Ils font apparaître le public, le lieu et « l’ambiance ». De cette manière, ils visent à faire percevoir, à distance, ce qu’ils comprennent comme les qualités d’une soirée Sofar Sounds : le partage d’une forme d’intimité avec la performance et de proximité avec les artistes. On retrouve des procédés relativement similaires dans d’autres formats de performances musicales filmées comme la Blogothèque (Desrochers, 2010) ou les Boiler Room (Heuguet, 2014). Composer cette mise en ordre sensorielle mobilise une attention à des indices ou à des signes différents de ceux de l’enregistrement en studio. À la suite de Fernando Dominguez Rubio (2020), j’ai qualifié cette mise en ordre de mimographique parce qu’elle consiste à « faire avec » les matériaux à disposition pour prolonger la performance sous une forme nouvelle : une vidéo publiée sur YouTube.

53Troisièmement, j’ai insisté sur la précarité du travail de production audiovisuelle. D’une part, la production audiovisuelle est précaire parce que les gestes des techniciens ne sont pas donnés, ni ne suivent un protocole déjà tout tracé. Au contraire, ils sont nourris de doutes et reposent sur un travail contingent de composition avec les matériaux. À ce titre, la production éprouve les techniciens et remet en jeu leurs expertises sensorielles. D’autre part, la production audiovisuelle est précaire parce que ce travail n’est pas tout à fait viable (Tsing, 2017), au sens où les techniciens manquent de ce dont ils ont besoin pour le mener à bien. Ce qui fait justement l’attachement des techniciens à la production de vidéos Sofar Sounds — par rapport aux emplois qui leur permettent de gagner leur vie — peut facilement (les) déborder. Ils doivent composer avec une organisation du travail qui ne correspond pas à ce que leur perception les invite à entreprendre, et risquent de ne pas savoir mettre fin à une tâche qui peut alors devenir disproportionnée. Il y a dans le travail perceptif quelque chose qui relève d’un risque attentionnel. De ce point de vue, poser la question des sens permet aussi de ressaisir dans des termes plus proches de l’activité des questions qui portent sur l’expérience du travail et de son caractère éventuellement précaire (Bidet, 2011 ; Denis et Pontille, 2022).

Haut de page

Bibliographie

Auray, N., 2017, L’Alerte ou l’enquête. Une sociologie pragmatique du numérique, Presses des Mines, Paris.

Bates, E., 2012, « What Studios do », Journal on the Art of Record Production, n° 7, en ligne : https://www.arpjournal.com/asarpwp/what-studios-do/.

Bates, E., 2016, Digital Tradition: Arrangement and Labor in Istanbul’s Recording Studio Culture, Oxford University Press, Oxford.

Battentier, A., 2021, A Sociology of Sound Technicians: Making the Show Go on, Springer, Berlin.

Battentier, A., Kuipers, G., 2020, « Les intermédiaires techniques et l’agentivité des objets. Comment les ingénieurs du son contribuent au sens des concerts », Biens symboliques, n° 6, en ligne : https://0-doi-org.catalogue.libraries.london.ac.uk/10.4000/bssg.442.

Besenval, M., 2021, « Résister dans les interstices : La subversion au travail dans un studio de création de jeux vidéo », Sociologie du travail, vol. 63, n° 1, en ligne : https://0-doi-org.catalogue.libraries.london.ac.uk/10.4000/sdt.37951

Bessy, C., Chateauraynaud, F., 2014 [1995], Experts et faussaires. Pour une sociologie de la perception, Nouvelle édition, Pétra, Paris.

Bidet, A., 2008, « L’homme et l’automate. L’écologie élargie du travail contemporain », Sociologie du travail, vol. 50, n° 3, p. 372-395.

Bidet, A., 2010, « Qu’est-ce que le vrai boulot ? Le cas d’un groupe de techniciens », Sociétés contemporaines, n° 78, p. 115-135.

Bidet, A., 2011, « La multi-activité, ou le travail est-il encore une expérience  ? », Communications, vol. 89, n° 2, p. 9-26.

Bidet, A., Boutet, M., 2007, « Pour une sociologie pragmatiste des activités », in Cefaï, D, Saturno, C. (dir.), Itinéraires d’un pragmatiste. Autour d’Isaac Joseph, Economica, Paris, p. 185-201.

Boutet, M., 2008, « S’orienter dans les espaces sociaux en ligne. L’exemple d’un jeu », Sociologie du travail, vol. 50, n° 4, p. 447-470.

Bovet, A., Sormani, P., Terzi, C., 2014, « The Televisual Accountability of Reality TV : The Visual Morality of Musical Performances in Talent Shows », in Broth, M., Laurier, E., Mondada, L. (dir.), Studies of Video Practices, Routledge, Londres, p. 216-242.

Brooker, P., Sharrock, W., 2016, « Collaborative Music-Making with Digital Audio Workstations: The “nth Member” as a Heuristic Device for Understanding the Role of Technologies in Audio Composition », Symbolic Interaction, vol. 39, n° 3, p. 463-483.

Broth, M., 2008, « The Studio Interaction as a Contextual Resource for TV-Production », Journal of Pragmatics, vol. 40, n° 5, p. 904-926.

Callon, M., Méadel, C., Rabeharisoa, V., 2000, « L’économie des qualités », Politix, n° 52, p. 211-239.

Camus, A., 2019, « Faire valoir un patrimoine. Comment une école polytechnique investit la numérisation de la collection audiovisuelle d’un festival musical », Thèse de doctorat, Université de Lausanne, Lausanne.

Camus, L., 2015, « Réaliser en direct : une vidéo-ethnographie de la production interactionnelle du match de football télévisé depuis la régie », Thèse de doctorat, Télécom ParisTech, Paris.

Camus, L., 2017, « La faute et son ralenti. Le cadrage temporel et visuel de l’action normée », Temporalités, n° 25, en ligne : https://0-doi-org.catalogue.libraries.london.ac.uk/10.4000/temporalites.3635.

Camus, L., 2021, « Le problème de la fidélité au réel dans la réalisation télévisée du football », Télévision, n° 12, p. 103-120.

Citton, Y., 2014, L’économie de l’attention. Nouvel horizon du capitalisme ?, La Découverte, Paris.

Clarke, E.F., 2005, Ways of Listening: An Ecological Approach to the Perception of Musical Meaning, Oxford University Press, Oxford.

Coulter, J., Parsons, E.D., 1990, « The Praxiology of Perception: Visual Orientations and Practical Action », Inquiry, vol. 33, n° 3, p. 251-272.

Delavaud, G., 2010, « Historique du terme “audiovisuel” », in « Archimages 2010. De la création à l’exposition : les impermanences de l’œuvre audiovisuelle », Actes de colloque, 17-19 novembre 2010, Paris, p. 1-6.

Denis, J., 2001, « L’échafaudage d’une identité collective publique : habillage d’antenne et autopromotion télévisuelle », Thèse de doctorat, Université de Toulouse 2, Toulouse.

Denis, J., Pontille, D., 2020a, « Maintenance et attention à la fragilité », SociologieS, en ligne : https://0-doi-org.catalogue.libraries.london.ac.uk/10.4000/sociologies.13936.

Denis, J., Pontille, D., 2020b, « L’effacement des graffitis à Paris », in Dodier, N., Stavrianakis, A. (dir.), Les objets composés. Agencements, dispositifs, assemblages, Éditions de l’EHESS, Paris, p. 41-74.

Denis, J., Pontille, D., 2022, Le soin des choses. Politiques de la maintenance, La Découverte, Paris.

Despret, V., 2004, « The Body We Care for: Figures of Anthropo-zoo-genesis », Body & Society, vol. 10, n° 3-4, p. 111-134.

Desrochers, J.-P., 2010, « Les vidéastes de la Blogothèque. Travailler à la réinvention de la captation des prestations musicales », Séquences : la revue de cinéma, n° 268, p. 12-13.

Dominguez Rubio, F., 2020, Still Life: Ecologies of the Modern Imagination at the Art Museum, University of Chicago Press, Chicago.

Dubuisson, S., Hennion, A., 2013, Le Design : l’objet dans l’usage, Presses des Mines, Paris.

Dutheil-Pessin, C., Ribac, F., 2017, La fabrique de la programmation culturelle, La Dispute, Paris.

Fourmentraux, J.-P., 2010, Art et internet, CNRS Éditions, Paris.

François, P., 2002, « Production, convention et pouvoir. La construction du son des orchestres de musique ancienne », Sociologie du travail, vol. 44, n° 1, p. 3-19.

Garfinkel, H., 2009, Recherches en ethnométhodologie, Presses universitaires de France, Paris.

Glevarec, H., 1999, « Le travail à France Culture comme action située. Sociologie de la production radiophonique », Sociologie du travail, vol. 41, n° 3, p. 275-293.

Goodwin, C., 1994, « Professional Vision », American Anthropologist, vol. 96, n° 3, p. 606-633.

Grimaud, E., 2003, Bollywood Film Studio ou comment les films se font à Bombay, CNRS éditions, Paris.

Grimaud, E., 2007, « The Film in Hand. Modes of Coordination and Assisted Virtuosity in the Bombay Film Studios », Qualitative Sociology Review, vol. 3, n° 3, p. 59-77.

Grimaud, E., 2015, « Mountable Cameras, Flexible Studios and the Perspectivist Turn », in Farías, I., Wilkie, A. (dir.), Studio Studies: Operations, Topologies & Displacements, Routledge, Londres et New York, p. 56-69.

Grosjean, S., Matte, F., Nahon-Serfaty, I., 2021, « “Sensory Ordering” in Nurses’ Clinical Decision-Making: Making Visible Senses, Sensing, and “Sensory Work” in the Hospital », Symbolic Interaction, vol. 44, n° 1, p. 163-182.

Haeringer, A.-S., Pecqueux, A., 2020, « La vulnérabilité comme ouverture à la contingence. Deux enquêtes situées », SociologieS, en ligne : https://0-doi-org.catalogue.libraries.london.ac.uk/10.4000/sociologies.14011.

Hennion, A., 1983, « Une sociologie de l’intermédiaire : le cas du directeur artistique de variétés », Sociologie du travail, vol. 25, n° 4, p. 459-474.

Hennion, A., 1986, « La prise de son : une redéfinition de l’unité musicale », Vibrations, vol. 2, n° 1, p. 124-132.

Hennion, A., 1993, La passion musicale. Une sociologie de la médiation, Éditions Métailié, Paris.

Hennion, A., 2002, « L’écoute à la question », Revue de musicologie, vol. 88, n° 1, p. 95-149.

Hennion, A., 2009, « Réflexivités. L’activité de l’amateur », Réseaux, n° 154, p. 55-78.

Hennion, A., 2017, « From Valuation to Instauration : On the Double Pluralism of Values », Valuation Studies, vol. 5, n° 1, p. 69-81.

Hennion, A., 2018, « L’objet, la croyance et le sociologue. La sociologie de l’art comme œuvre à faire », Transposition, Hors-série 1, en ligne : https://0-doi-org.catalogue.libraries.london.ac.uk/10.4000/transposition.1673.

Hennion, A., Teil, G., 2004, « Le goût du vin. Pour une sociologie de l’attention », in Nahoum-Grappe, V., Vincent, O. (dir.), Le goût des belles choses, Éditions de la Maison des Sciences de l’Homme, Paris, p. 111-126.

Heuguet, G., 2014, « Quand la culture de la discothèque est mise en ligne : le cas du site Boiler Room », Culture & Musées, n° 24, p. 107-124.

Heuts, F., Mol, A., 2013, « What is a Good Tomato? A case of Valuing in Practice », Valuation Studies, vol. 1, n° 2, p. 125-146.

Horning, S.S., 2004, « Engineering the Performance: Recording Engineers, Tacit Knowledge and the Art of Controlling Sound », Social Studies of Science, vol. 34, n° 5, p. 703-731.

Jayyusi, L., 1993, « The Reflexive Nexus : Photo-Practice and Natural History », Continuum: Journal of Media & Cultural Studies, vol. 6, n° 2, p. 25-52.

Kealy, E.R., 1979, « From Craft to Art: The Case of Sound Mixers and Popular Music », Sociology of Work and Occupations, vol. 6, n° 1, p. 3-29.

Latour, B., Lowe, A., 2011, « La migration de l’aura ou comment explorer un original par le biais de ses fac-similés », Intermédialités, n° 17, p. 173-191.

Lizé, W., Naudier, D., Roueff, O., 2011, Intermédiaires du travail artistique : à la frontière de l’art et du commerce, La Documentation française, Paris.

Macbeth, D., 1999, « Glances, trances, and their relevance for a visual sociology », in Jalbert, P.L. (dir.), Media Studies: Ethnomethodological Approaches, University Press of America, Lanham, p. 135-170.

Menger, P.-M., 2002, Portrait de l’artiste en travailleur, Le Seuil, Paris.

Muniesa, F., Trébuchet-Breitwiller, A.-S., 2010, « Becoming a Measuring Instrument: An Ethnography of Perfume Consumer Testing », Journal of Cultural Economy, vol. 3, n° 3, p. 321-337.

Péquignot, J., 2018, « Clip et discours : pragmatique de l’énonciation », Volume !, vol. 14, n° 1, p. 111-124.

Perrenoud, M., 2021, « Pour un interactionnisme dispositionnaliste dans l’étude du travail. Le cas de l’espace professionnel des musicien.ne.s ordinaires », SociologieS, en ligne : https://0-doi-org.catalogue.libraries.london.ac.uk/10.4000/sociologies.16646.

Perry, M., Juhlin, O., Engström, A., 2014, « Dealing with Time, Just In Time: Sense-Making and Clip Allocation in Multiperson, Multistream, Live Replay TV Production », in Broth, M., Laurier, E., Mondada, L. (dir.), Studies of Video Practices, Routledge, Londres, p. 270-294.

Picaud, M., 2021, Mettre la ville en musique (Paris-Berlin), Presses universitaires de Vincennes, Vincennes.

Porcello, T., 2005, « Music mediated as live in Austin : sound, technology, and recording practice », in Greene, P.D., Porcello, T. (dir.), Wired for Sound : Engineering and Technologies in Sonic Cultures, Wesleyan University Press, Middletown, p. 103-117.

Ribac, F., 2007, « From the Scientific Revolution to Rock: Toward a Sociology of Feedback », Journal of the Art of Record Production, n° 1, en ligne : https://www.arpjournal.com/asarpwp/from-the-scientifc-revolution-to-rock/.

Ribac, F., 2012, « Quand l’amateur rend le numérique analogique », Revue d’anthropologie des connaissances, vol. 6, n° 3, p. 717-741.

Riom, L., 2020, « Discovering Music at Sofar Sounds: Surprise, Attachment, and the Fan–Artist Relationship », in Tofalvy, T., Barna, E. (dir.), Popular Music, Technology, and the Changing Media Ecosystem, Springer, Cham, p. 201-216.

Riom, L., 2021, « Faire compter la musique. Comment recomposer le live à travers le numérique (Sofar Sounds, 2017-2020) », Thèse de doctorat, CSI Mines-Paristech, Université PSL, Paris.

Riom, L., 2022, « Mettre la musique en public : quelques réflexions à partir d’une ethnographie des soirées de Sofar Sounds », in Rescigno, A., Turbé, S., Valkauskas, E. (dir.), Le public dans tous ses états, Presses universitaires de Nancy, Nancy, p. 81-100.

Riom, L., 2023a, « (Un)Playing Music at Sofar Sounds: Some Elements of an Ethno(musico)methodology of Live Performances », Ethnomusicology Review, n° 24, en ligne : https://ethnomusicologyreview.ucla.edu/journal/volume/24/piece/1098.

Riom, L., 2023b, « “A Video or a Flat Fee ?” On the performances of concert fees », Journal of Cultural Economy, en ligne : https://0-doi-org.catalogue.libraries.london.ac.uk/10.1080/17530350.2023.2225525.

Riom, L., Spanu, M., 2023, « Les nouvelles médiations audiovisuelles de la musique live : formats, industrie et patrimoine culturel numérique », SociologieS, en ligne : https://0-doi-org.catalogue.libraries.london.ac.uk/10.4000/sociologies.21823

Rosselin, C., Lalo, E., Nourrit, D., 2015, « Prendre, apprendre et comprendre. Mains et matières à travailler chez les scaphandriers », ethnographiques.org, n° 31, en ligne : https://www.ethnographiques.org/2015/Rosselin-Lalo-Nourrit.

Rot, G., 2019, Planter le décor, Presses de Sciences Po, Paris.

Rot, G., 2020, « L’épreuve de la prise de sons sur les plateaux de tournage. Entre maîtrise de l’environnement sonore et apprivoisement de l’imprévu », Socio-anthropologie, n° 41, p. 179-193.

Rot, G., Vatin, F., 2016, « Surveiller les flux, contrôler les hommes. Du travail et de sa division dans l’industrie chimique et nucléaire », Sociologie et sociétés, vol. 48, n° 1, p. 97-116.

Saint-Georges, I. de, 2010, « Usage des objets et transformation des compétences en formation professionnelle initiale. Une trajectoire de mise en objet dans l’atelier d’assemblage des matériaux », in Adé, D., Saint-Georges, I. de (dir.), Les objets dans la formation : usages, rôles et significations, Octarès, Toulouse, p. 125-141.

Schmidt-Horning, S., 2012, « The Sounds of Space : Studio as Instrument in the Era of High Fidelity, in Frith, S., Zagorski-Thomas, S. (dir.), The Art of Record Production: An Introductory Reader for a New Academic Field, Ashgate, Farnham, p. 29-42.

Straw, W., 1988, « Music Video in its Contexts: Popular Music and Post-Modernism in the 1980s », Popular Music, vol. 7, n° 3, p. 247-266.

Tabouret, S., 2021, « Les cépages résistants, du labo à la vigne. Quand l’expérimentation met à l’épreuve les pratiques vitivinicoles, les variétés de vigne et les propriétés du vin », Thèse de doctorat, CSI Mines-Paristech, Université PSL, Paris.

Tanferri, M., Vinck, D., Waeber, S., 2023, « “Peut-être que je peux retomber sur ses pattes ?” Agentivités multiples dans la préparation d’un DVD de spectacle à partir de sa captation en direct », SociologieS, en ligne : https://0-doi-org.catalogue.libraries.london.ac.uk/10.4000/sociologies.21338.

Teil, G., 2001, « La production du jugement esthétique sur les vins par la critique vinicole », Sociologie du travail, vol. 43, n° 1, p. 67-89.

Théberge, P., 1997, Any Sound you can Imagine: Making Music/Consuming Technology, Wesleyan University Press, Middletown.

Théberge, P., 2004, « The Network Studio : Historical and Technological Paths to a new Ideal in Music Making », Social Studies of Science, vol. 34, n° 5,p. 759-781.

Thompson, E.A., 1995, « Machines, Music, and the Quest for Fidelity: Marketing the Edison Phonograph in America, 1877-1925 », The Musical Quarterly, vol. 79, n° 1, p. 131-171.

Thompson, E.A., 2004, The Soundscape of Modernity: Architectural Acoustics and the Culture of Listening in America, 1900-1933, MIT Press, Cambridge.

Tsing, A.L., 2017, Le champignon de la fin du monde. Sur la possibilité de vie dans les ruines du capitalisme, La Découverte, Paris.

Vernallis, C., 2004, Experiencing Music Video: Aesthetics and Cultural Context, Columbia University Press, New York.

Vinck, D., 2019, Les métiers de l’ombre de la Fête des Vignerons, Antipodes, Lausanne.

Vinck, D., Waeber, S., Tanferri, M., 2021, « Produire un son “naturel” : imbrication et différenciation de l’analogique et du numérique pour créer l’univers sonore d’un grand spectacle », TSANTSA, n° 26, p. 51-70.

Watson, A., 2014, Cultural Production in and beyond the Recording Studio, Routledge, Londres et New York.

Zimmermann, B., 2015, Waves and Forms: Electronic Music Devices and Computer Encodings in China, MIT Press, Cambridge et Londres.

Haut de page

Notes

1 Pour un panorama sur cette question voir Riom et Spanu, 2023.

2 J’emprunte cette notion à Christian Bessy et Francis Chateauraynaud (2014 [1995]).

3 Depuis les travaux pionniers d’Howard Becker, ce dialogue est déjà engagé, notamment dans cette revue. Voir par exemple François, 2002 ; Besenval, 2021.

4 J’utilise ici et dans la suite de l’article uniquement le masculin pour désigner les techniciens de Sofar Sounds, parce que l’ensemble des personnes que j’y ai rencontrées ou dont j’ai pu observer le travail lors de mon enquête étaient des hommes. L’utilisation du langage épicène lorsque je parle des équipes de Sofar Sounds tendrait à invisibiliser ce constat. Dans le reste du texte, une écriture inclusive est utilisée qui recourt à l’accord de proximité lorsque les formes masculine et féminine sont déclinées séparément.

5 Si le travail d’Antoine Hennion a abondamment nourri les réflexions sur les amateurices et même sur le travail des artistes, l’étude des intermédiaires s’inscrit, elle, davantage dans l’héritage de la sociologie des professions que de celle de l’activité.

6 Ce point est encore peu relevé dans les travaux sur les intermédiaires. Par exemple, à de rares mais notables exceptions près (Dutheil-Pessin et Ribac, 2017), la façon dont ils et elles écoutent de la musique n’intervient pas ou peu dans la description de leur activité.

7 Dans un bref historique du terme, Gilles Delavaud (2010) note que la question de l’articulation entre images et son est présente dès la deuxième partie du XIXe siècle. À ce titre, Thomas Edison présente le phonographe comme l’équivalent pour le son de la photographie, en esquissant déjà la possibilité de combiner ces deux techniques dans un même contenu.

8 La production de soirées en « partenariat » est le deuxième modèle d’affaire de l’entreprise. Ces dernières années, Sofar Sounds a organisé des soirées pour la bière Stella Artois, la chaîne d’hôtels Hyatt Centric ou la société de production cinématographique Century Studio à l’occasion de la sortie du film Bohemian Rhapsody.

9 L’ensemble des noms des personnes interviewées sont des pseudonymes. L’entreprise, en revanche, n’est pas anonymisée, ce qu’elle a accepté.

10 Susan Schmidt-Horning (2012) montre que le « close-miking » a été développé à mesure que l’espace est devenu une préoccupation centrale de l’enregistrement. La question pour les ingénieur·es du son était alors de savoir comment exploiter le microphone pour faire disparaître l’effet de la spatialité — l’écho et la réverbération — pour ensuite le recréer à leur guise en studio (voir également Thompson, 2004 ; Porcello, 2005).

11 Cette organisation ressemble à ce que l’on peut observer dans la retransmission d’événements en direct (Perry et al., 2014 ; Vinck, 2019), avec une régie son et une régie images clairement séparées l’une de l’autre.

12 WAV, pour Waveform Audio File Format, est un standard largement utilisé dans le domaine de la production audio. Le MPEG-4 est une norme de codage couramment employé pour les fichiers vidéo. Les cartes SD, pour Secure Digital, sont des cartes amovibles qui permettent de stocker des données numériques. Elles sont souvent utilisés dans les appareils photo et les caméras.

13 Sur la façon dont la captation requiert une expertise pour gérer de l’espace, voir également Rot, 2020.

14 Pro Tools se présente comme une « station audionumérique ». Il est l’un des logiciels de référence aussi bien pour l’enregistrement que pour le mixage ou la postproduction.

15 Sur ce point, voir aussi Bates, 2016 ; Camus, 2019.

16 Une DI (pour direct input ou direct inject) est un dispositif utilisé pour éviter les pertes de signal. Elle sert souvent à amplifier des pianos électroniques, des synthétiseurs, des (contre)basses ou des guitares électro-acoustiques.

17 Avant la soirée, chaque artiste indique deux titres qu’il ou elle souhaite enregistrer (un premier choix et un plan de secours en cas de problème pendant la performance).

18 Cette nouvelle propriété est réglée par le contrat signé avec les artistes, qui garantit à Sofar Sounds l’utilisation de la vidéo.

19 Le mastering consiste à « imprimer » (selon les mots de Bastien) le mix sur une seule piste, afin que celle-ci puisse être écoutée sur différents supports audios en conservant une qualité sonore proche du mix original.

20 Le Museum of Modern Art de New York.

Haut de page

Pour citer cet article

Référence électronique

Loïc Riom, « La production audiovisuelle au travail. Expertises et perceptions des techniciens dans la production de vidéos Sofar Sounds »Sociologie du travail [En ligne], Vol. 65 - n° 4 | Octobre-Décembre 2023, mis en ligne le 15 novembre 2023, consulté le 16 mai 2025. URL : http://0-journals-openedition-org.catalogue.libraries.london.ac.uk/sdt/44613 ; DOI : https://0-doi-org.catalogue.libraries.london.ac.uk/10.4000/sdt.44613

Haut de page

Auteur

Loïc Riom

STS Lab, Institut des sciences sociales (ISS)
Faculté des sciences sociales et politiques, Université de Lausanne, Bâtiment Géopolis, Quartier UNIL-Mouline, CH-1015 Lausanne, Suisse
loic.riom[at]unil.ch

Haut de page

Droits d’auteur

CC-BY-NC-ND-4.0

Le texte seul est utilisable sous licence CC BY-NC-ND 4.0. Les autres éléments (illustrations, fichiers annexes importés) sont « Tous droits réservés », sauf mention contraire.

Haut de page
Rechercher dans OpenEdition Search

Vous allez être redirigé vers OpenEdition Search