Bonjour à tous !
J'avais envie de faire un tuto sur un sujet qui me tient à cœur et qu'il ne me semble pas avoir trop vu de par ce forum, donc, je me lance
On va parler, vous l'avez deviné, de mise en scène ! Qui peut se résumer en saga MP3 presque par un unique paramètre : la panoramique (ou panning, ou pan), c'est à dire pour les 0,04 % qui ne savent pas ce que c'est, le placement dans l'espace stéréo d'une source sonore, c'est à dire déterminer si celle-la va être plus ou moins à gauche ou à droite.
Une piste stéréo, techniquement, n'est rien d'autre que deux pistes monos, chacune sur un canal : le gauche, destiné à l'oreille gauche (si on porte un casque) et le droit, destiné à l'oreille droite. Si les deux canaux diffusent exactement la même chose au même volume et en même temps, on a l'impression que la source sonore vient du milieu. Dans ce cas, la stéréo est aussi utile qu'un cerveau dans le crâne d'un militaire. En revanche si l'un des canaux diffuse la même chose mais à plus bas volume, on a l'impression que le son est « décalé » vers l'autre. Par exemple, si le gauche est moins fort, le son va sembler provenir de la droite. Et c'est le fait de jouer avec ces différences de niveaux qu'on va appeler, tadam, la panoramique.
Ainsi, on pourra avoir des réglages qui vont de 100% gauche à 100% droite en passant par toutes les valeurs intermédiaires. Quant à l'unité de mesure utilisée, là, ça dépend du logiciel : de 0 à 127 ; de -10 à 10 ; de -64 à 64 etc... etc... mais sans entrer dans les détails, le principe demeure le même.
Comment régler cette panoramique dans le cadre d'une saga MP3 ? Je dirais qu'il y a deux méthodes. La première et la plus facile, c'est d'assigner une place à chacun des personnages : Gérard va être 40% à droite, Germaine 20% à droite et Cunégonde 17,38% à gauche, et de ne plus en bouger. De grands créateurs l'ont adoptée (PoC et JBX pour ne citer qu'eux) et ça marche bien : c'est pratique, simple, fonctionnel, on peut mémoriser ses réglages et ça évite les bourdes. La deuxième, c'est d'envisager le micro comme une caméra et par conséquent d'adopter une mise en scène plus « cinématographique » où les personnages n'auront jamais la même place, où ils bougeront, etc... Et là ça devient tout de suite plus complexe.
(pour la suite et pour éviter les confusions, je désignerai sous le terme de « caméra » le micro virtuel qui est censé enregistrer la scène comme elle se déroule, je ne parle pas de celui bien réel qui sert à enregistrer les répliques^^)
Il y a donc dans ce cas-là plusieurs paramètres à prendre en compte que sont le placement de la caméra (cf parenthèse précédente), ou point de vue, l'angle de vue et la distance des sources sonores par rapport à la caméra. Ainsi que, je cite pour mémoire la profondeur de champ, mais je ne détaillerai pas ce dernier point.
Le point de vue, c'est là ou on va placer la caméra, mettons dans le coin d'une pièce. Sur le mur de droite il y a une télé allumée, sur celui de gauche, une porte. André ouvre la porte (qu'on entend à gauche), ses bruits de pas vont de gauche à droite et il éteint la télé qu'on entendait précédemment à droite. Jusque là, rien de bien compliqué. Il s'agit juste de placer les différents éléments sonores de manière cohérente et réaliste pour ça je vous fait confiance.
C'est quand on va vouloir donner des valeurs à ces placements qu'il va falloir également envisager l'angle de vue ou angle de champ (c'est pareil). Wikipédia m'a dit un jour :
Citer:
En vidéo, au cinéma et en photographie l’angle de champ correspond à l’angle qui délimite le champ couvert par l'objectif monté sur l'appareil de prise de vues.
C'est à dire en gros, sur une caméra, les limites des bords droit et gauche. Et bien sur la nôtre, c'est pareil, elle va capter un « cône » sonore dont les limites droite et gauche vont coïncider avec notre fameux angle de vue. Prenons deux situations en exemple, une pièce fermée où sont présents trois personnages et notre caméra. Ces quatre entités sont placés aux mêmes endroits mais les réglages de panoramique vont être différents selon l'angle adopté. Voici pour expliciter mon propos, deux superbes schémas (admirez au passage mes talents d'infographe) :
Angle serré : l'angle est resserré autour des deux personnages centraux en excluant le troisième. La valeur indiquée correspond à l'angle formée par la droite qui passe par la caméra et la source sonore (ici la bouche du personnage) et la bissectrice de l'angle de vue, dans notre cas, 40% (à la louche).
Grand angle : l'angle de vue est beaucoup plus important et englobe les trois personnages. Selon la même méthode de calcul que précédemment, nous obtenons des valeurs différentes : les deux personnages centraux qui n'ont pas bougé ne sont maintenant plus qu'à 15% d'angle de la bissectrice (le centre).
Il faut assimiler ça, si l'on continue sur notre métaphore cinématographique à, respectivement : un gros plan, et un plan large, et possède donc la même valeur narrative : l'angle serré va focaliser l'action sur un élément en particulier (manipulation d'un objet, dialogue à voix basse, etc...) tandis que le grand angle va représenter toute une scène avec décors et personnages, et va témoigner d'une certaine distance (en mètres) entre toutes les sources sonores, alors que pour l'angle serré, l'échelle serait plutôt de l'ordre de la dizaine de centimètres.
Et, bien évidemment, entre ces deux extrêmes, il y a tout un tas de valeurs intermédiaires, ne soyons pas si manichéens, que diable.
Parlons un peu de la distance entre la source sonore et notre caméra. Vous vous dites « ben c'est simple : plus c'est loin, moins c'est fort », ce à quoi je répond, oui et non. Mais avant d'aller plus loin, il faut que je vous parle d'une caractéristique du son.
Celui-ci, quand il est produit, va d'abord voyager dans l'air, il va rebondir, il va être absorbé, etc... là où je veux en venir c'est qu'entre la source sonore et le micro qui va la capter, le son vit, change et se transforme.
Une onde sonore produite « naturellement » contient tout un tas de fréquences différentes, plus ou moins graves, qui ne se comportent pas toutes de la même manière face à l'adversité. Créons deux catégories, fréquences aiguës, et fréquences graves.
Les fréquences aiguës vont perdre de l'énergie beaucoup plus rapidement que leurs collègues, c'est à dire qu'elle vont se « perdre » : s'atténuer et se transformer bien plus facilement. Ceci va nous servir à déterminer l'éloignement ou la proximité des différences sources sonores, et on peut ajouter à notre « Plus c'est loin moins c'est fort » un autre adage tout aussi catapulté : « Plus c'est loin, moins il y a d'aigus » (pour les 0,04% qui ne le savaient pas : on utilise un équaliseur pour renforcer ou atténuer seulement certaines fréquences).
Paradoxalement, des basses très présentes dans certains cas donnent ce qu'on appelle un « effet de proximité » où l'on a l'impression que la source est très... très proche. Cela s'obtient en enregistrant à quelques centimètres (prévoir un bon anti-pop) d'un micro cardioïde (si vous ne savez pas ce que c'est,
cet article comporte un paragraphe sur la directivité très bien écrit).
Donc, on a vu que le son se transformait entre son émission et sa capture. Mais non content de cela, le bougre, il va en plus rebondir partout sur les murs et le plafond et le sol et les meubles et les gens et... et... etc... Pour de plus amples informations sur les réglages de réverbération, veuillez taper « révèrbe » dans le champ de recherche du forum.
Or, il advient que ce qui va capter le son, en l’occurrence notre caméra, va aussi capter sa réverbération. Et plus la source est loin, plus le son a le temps de se réverbérer (c'est un peu inexact, mais dans les faits, c'est ça). D'où nous pouvons tirer, tout contents, un nouvel axiome : « Plus c'est loin, plus c'est réverbéré ». Par chance, tous les effets de réverbe ont un réglage dry/wet : dry, c'est le son complètement « sec » sans aucune réverbération. Wet, c'est le son complètement mouillé, c'est à dire qu'il n'y a plus que sa réverbération.
Récapitulons.
Plus c'est loin...
… moins c'est fort
… moins il y a d'aigus
… plus c'est réverbéré
À l'inverse, plus c'est près...
… plus c'est fort (attention à la saturation)
… plus il y a d'aigus
… moins c'est réverbéré.
Revenons à notre angle de champ, et je vais même reprendre un des deux schémas précédents tellement je suis feignant.
Rappellez-vous...
Les deux personnages sont respectivement 40% à gauche et à droite. On a vu que le réglage de la panoramique dépendait du placement ou autrement dit de la distance et de l'angle de vue, comme une sorte d'équation
pan = angle x distance
Par conséquent, si l'on augmente l'angle, mais qu'à l'inverse on réduit proportionnellement la distance, on peut se retrouver avec les même réglages de panoramique. Démonstration :
Et, en théorie, parce que j'ai jamais essayé et que je ne l'ai jamais entendu, enfin je crois pas, on pourrait faire varier dans le temps les paramètres d'angle et de distance tout en conservant les mêmes réglages de panoramique pour obtenir un effet similaire à celui du travelling compensé. C'est si beau que j'en ai la larme à l'oeil.
Et tout ce qui précède est valable pour des sources sonores et une caméra qui ne bougent pas. C'est quand il y a du mouvement que, là, ça devient vraiment le bordel.
En premier lieu un petit mot à propos des mouvements de caméra. Au cinéma, il y a un support visuel, donc tout va bien. En saga MP3, c'est légèrement plus tendu parce qu'on a tendance à souvent plus considérer que ce sont les personnages qui bougent plutôt que la caméra. J'ai essayé de nombreuses choses et finalement, il n'y a presque rien qui marche, sauf dans le cas où la caméra et les personnages bougent en même temps. Dans ce cas, on ne touche pas aux réglages de panoramique et on travaille sur les ambiances sonores. Ceci dit, je vous invite à essayer des choses ! L'expérimentation peut être très enrichissante.
Donc, mettons que la caméra, elle, elle reste là où elle est, et que ce sont les personnages qui bougent autour d'elle et ça simplifiera grandement les choses.
Prenons un exemple bien concret : une voiture qui passe de gauche à droite à toute vitesse. On a donc besoin d'un grand angle, quant au placement, la caméra est au milieu de la route, elle capte perpendiculairement à cette dernière, et elle se trouve à quelque centimètres. Le bruitage « voiture_qui_roule.wav » dure 10 secondes.
Vous pensiez, naïvement, qu'il suffisait de faire passer linéairement la voiture de gauche à droite, puis de mettre un fondu en ouverture pendant les 5 premières secondes et en fermeture les 5 dernières. Et bien non ! Ce serait trop simple, bien sûr. Bon, déjà, en extérieur, pas de réverbération, ça, c'est fait et un potard de moins dont on devra se soucier. Mais comme la voiture commence loin, qu'elle passe près de la caméra pour de nouveau s'en éloigner, il va falloir donc au début : atténuer les fréquences aiguës, les augmenter progressivement jusqu'à 5 secondes (au moment où la voiture passe au plus près de la caméra) pour les ôter à nouveau petit à petit ensuite.
Le réglage de la panoramique quant à lui, est tout sauf linéaire. Je pourrais vous le démontrer de façon exacte (ce sont des simples calculs trigonométriques) mais on n'est pas là pour faire des maths donc croyez-moi sur parole : pour un même laps de temps donné, la panoramique varie moins vers les extrêmes qu'au centre de l'espace stéréo
Dans notre cas, c'est valable aussi pour l'évolution des graves et le volume pour des raisons qui ne vous regardent pas.
Note :On peut amplifier la courbure pour donner plus d'impact à l'effet.
Et vous pensiez que c'était tout ? Et non !! Car pour un objet qui va aussi vite qu'une voiture, un nouvel élément entre en jeu, qui porte le doux nom d'effet Doppler (du nom de son découvreur, j'imagine). Ce monsieur Doppler nous apprend qu'un son produit par un objet en mouvement paraît plus aigu quand il se rapproche et plus grave quand il s'éloigne. Pensez au camion de pompier qui passe toutes sirènes dehors. Ce n'est pas le gyrophare qui déconne, il fonctionne même très bien, c'est la faute à l'effet Doppler !
Nous avons donc pour notre voiture qui n'en demandait pas tant quatre paramètres à modifier dans le temps : l'amplitudes des fréquences aigües la panoramique comme expliqué ci-avant, le pitch, et, je n'en ai pas parlé mais c'était évident : le volume. Et un petit schéma. J'aime bien, les schémas, ça résume bien et ça aère le texte.
ERRATUM : Le titre du schéma est « Fréquences aiguës » contrairement à ce qui est marqué (je corrige dès que je peux) Bien évidemment, « les fréquences aiguës » désignent une bande de fréquences, donc plusieurs. Ici H signifie l'extrémité basse de la bande et B l'extrémité haute. Oui, les initiales sont inversées, cf. erratum ^^ Vous pouvez appliquer les même réglages sur toute la bande, on dira rien promis.
Bon, ben c'est l'effet Doppler en image. Pas grand-chose à en dire. À noter que, sur la zone centrale, il vaut mieux faire une variation progressive (même si elle ne dure qu'une fraction de seconde) plutôt qu'une coupe brutale, parce que sinon, ça clique. Sur le schéma, j'ai un peu « exagéré » la transition. Normalement, elle est plus courte.
Panoramique. Voir plus haut.
Attention aux saturations ! D'autant qu'en augmentant les aigus vers 5 sec au-delà du 0 dB (qui est une valeur relative à l'amplitude d'origine de la bande de fréquences), on peut dépasser le 0 dB (qui est cette fois le seuil de saturation numérique, ne pas confondre les deux). Voili voilou.
Cerise sur le gâteau, un "woosh" qui va de droite à gauche, très court, au moment où la voiture passe au centre.
J'ai décrit ici un cas « idéal », et en plus à propos d'une voiture, ce qui m'a permis de parler de l'effet Doppler et de la non-linéarité de la panoramique lors d'un mouvement gauche-droite (ou droite-gauche, ça marche aussi) tout ça parce que une voiture : ça roule vite. En pratique, sur des personnages en mouvement, on laissera de côté l'effet Doppler, et on linéarisera bien sagement la variation panoramique, c'est teeeeeeellement plus simple.
Voilà, voilà, en espérant vous avoir été d'une quelconque utilité,
Bien à vous,
Max
PS : Hein, quoi, une conclusion ? Naan, pas la peine.
PS2 : Je remercie Javeldose et Blast pour leur contribution, ce qui m'a permis d'améliorer le texte et corriger quelques erreurs.