La téléportation
à portée de casque !
Nous avions pu approcher le Smyth Realiser A8 lors du dernier salon HiFi Home Cinéma d’octobre 2010, où son importateur Mr Gérin le présentait sur un minuscule stand… Evidement, puisqu’avec cette petite machine quasiment magique, on peut faire tenir un énorme système 7.1 dans un simple casque de balladeur… ou presque !
A quoi sert le Smyth Realiser A8 ?
Selon l’expression de Gilles Gérin, le Smyth Realiser A8 est un «virtualiseur» ou encore un «audio-copieur» de salle qui permet de restituer, sur un casque stéréophonique, un dispositif multicanal complet (comprenant jusqu’à 8 sources sonores) ainsi que l’acoustique de la salle qui l’héberge.
Première utilisation possible : disposer dans le cadre d’une écoute au casque de la restitution sonore d’une installation audio-vidéo même complexe. L’utilisateur peut alors profiter des qualités de son propre système audio (ou de ceux qu’il a «copiés») à n’importe quelle heure du jour et de la nuit, possiblement dans n’importe quelle pièce de son domicile, sans déranger son entourage. Car avec ce dispositif, la notion de «sweet spot» disparaît totalement. L’auditeur retrouve donc une liberté de mouvement (seulement limitée par la longueur du câble du casque) sans rien perdre des qualités du système d’origine.
Deuxième possibilité : simuler en situation de mobilité quasiment n’importe quelle installation sonore et n’importe quelle acoustique de salle, pourvu que l’on y ait eu accès une fois et que l’on ait pu en personne y calibrer l’appareil. En personne, car nous le verrons, c’est la prise en compte de la morphologie précise de la paire d’oreilles de son propriétaire qui fait toute l’efficacité du dispositif ! Cette deuxième possibilité est susceptible d’intéresser les ingénieurs du son, puisqu’elle permet d’avoir une très bonne idée de ce que l’on enregistre, contrôle ou mixe, comme s’il on était face à un système de référence existant, et ce n’importe où dans le monde si l’on s’est déplacé avec l’appareil (qui fort heureusement est très compact). La notion de studio virtuel prend alors tout son sens, on peut pratiquement parler de téléportation dans une cabine de monitoring ou de mastering.
D’où vient-il ?
Cette invention américaine est due à l’ingéniosité des frères Myke et Steve Smyth, tous deux docteurs en physique, qui furent aussi les concepteurs de l’algorithme «Coherent Acoustics» développé par DTS. Elle a nécessité rien moins que cinq ans de développement et met en oeuvre de puissants algorithmes de traitement du signal. Cet appareil contient donc une électronique plutôt sophistiquée, dotée pour l’interface signal de convertisseurs analogique/numérique et numérique/analogique de course (des circuits Burr-Brown PCM 4204 et PCM 4104) travaillant sur 24 bits. Dans la chaîne de reproduction, l’appareil se positionne en effet entre les sorties analogiques d’un préamplificateur (ou directement d’un lecteur) et le casque (ou l’amplificateur spécifique du casque, si celui-ci le nécessite).
Le processeur utilisé est l’ADSP 21369 d’Analog Devices (fabricant qui comme son nom ne l’indique pas, produit aussi des circuits intégrés logiques). Il permet la calibration du système à partir d’une installation présentant jusqu’à 8 sources émissives, puis la restitution au casque avec un dispositif de suivi des mouvements de la tête par infrarouge. Ce suivi extrêmement précis et rapide (période de rafraîchissement : 5 ms) permet de stabiliser la scène sonore même lorsque l’on tourne la tête. Le système peut également mémoriser 4 configurations de salle et d’auditeur (en RAM), et 64 sur carte SD. Notons que cet appareil a obtenu un trophée au dernier SATIS, le salon professionnel des techniques audio-visuelles, en octobre 2010.
Le processeur utilisé est l’ADSP 21369 d’Analog Devices (fabricant qui comme son nom ne l’indique pas, produit aussi des circuits intégrés logiques). Il permet la calibration du système à partir d’une installation présentant jusqu’à 8 sources émissives, puis la restitution au casque avec un dispositif de suivi des mouvements de la tête par infrarouge. Ce suivi extrêmement précis et rapide (période de rafraîchissement : 5 ms) permet de stabiliser la scène sonore même lorsque l’on tourne la tête. Le système peut également mémoriser 4 configurations de salle et d’auditeur (en RAM), et 64 sur carte SD. Notons que cet appareil a obtenu un trophée au dernier SATIS, le salon professionnel des techniques audio-visuelles, en octobre 2010.
Un peu de théorie
Le principe technique repose sur la technique dite HRTF (pour Head Related Transfer Function), ou Fonction de transfert relative à la tête. Effectivement, notre tête, nos épaules, la géométrie (différente pour chaque individu) de nos pavillons d’oreille et de nos conduits auditifs, déterminent un filtrage complexe du champ sonore dans lequel nous sommes plongés, juste avant qu’il soit capté en deux points séparés de l’espace, par nos tympans. Et en dépit du fait que nous ne possédons que deux oreilles, nous percevons bien l’espace sonore qui nous entoure selon ses trois dimensions (largeur, profondeur, hauteur).
Nous devons cela à la forme si particulière de nos pavillons d’oreille, aux phénomènes de réflexion, diffraction et résonances qui s’y produisent. La discrimination haut/bas et avant/arrière est notamment due au fait qu’ils ne sont pas symétriques ni selon l’axe vertical, ni selon l’axe horizontal.
Cela étant, les mesures sur individu montrent que si la précision de localisation auditive selon un cône frontal correspondant peu ou prou à notre champ visuel est excellente (de l’ordre du degré), il nous est plus difficile de localiser avec précision des objets sonores positionnés derrière nous ou seulement très écartés de la direction de notre regard (erreur de 5 à 15 °).
Cela étant, les mesures sur individu montrent que si la précision de localisation auditive selon un cône frontal correspondant peu ou prou à notre champ visuel est excellente (de l’ordre du degré), il nous est plus difficile de localiser avec précision des objets sonores positionnés derrière nous ou seulement très écartés de la direction de notre regard (erreur de 5 à 15 °).
Lors de l’écoute d’un message et d’un système stéréophonique, on profite des capacités de localisation gauche/droite, et dans une moindre mesure avant/arrière du système auditif humain. On reconstitue une image sonore qui se déploie dans le plan horizontal passant par nos oreilles, et qui est typiquement comprise dans le secteur défini par la position de l’auditeur et les deux enceintes. Rappelons au passage qu’une installation stéréophonique «idéale» positionne l’auditeur et les deux enceintes aux sommets d’un triangle équilatéral. Chaque sommet de ce triangle voit donc les deux autres sous une ouverture angulaire de 60 degrés.
Il manque donc quand même à la stéréophonie pas moins de 5 secteurs géométriques de 60° pour pouvoir réaliser une véritable scène sonore en deux dimensions ! Scène que parviennent plus ou moins à recréer les systèmes multicanaux, qui mettent en oeuvre des voies latérales (cas du 5.1) et arrières (7.1).
Et il suffirait de rajouter des canaux en hauteur ou en contrebas de la position de l’auditeur pour reproduire aussi des effets d’élévation : c’est la fameuse et presque délirante proposition d’un système 22.2 faite par Kimio Hamasaki de la NHK, lors du dernier Forum International du Son Multicanal, et qui positionne les enceintes selon un maillage spatial complètement enveloppant.
L’écoute stéréophonique traditionnelle au casque positionne quant à elle l’ensemble des sources sonores à l’intérieur du crâne, sur un axe passant par les deux oreilles. L’auditeur n’a donc pas de recul par rapport à la scène sonore, et sa profondeur n’est que difficilement perceptible.
Il manque donc quand même à la stéréophonie pas moins de 5 secteurs géométriques de 60° pour pouvoir réaliser une véritable scène sonore en deux dimensions ! Scène que parviennent plus ou moins à recréer les systèmes multicanaux, qui mettent en oeuvre des voies latérales (cas du 5.1) et arrières (7.1).
Et il suffirait de rajouter des canaux en hauteur ou en contrebas de la position de l’auditeur pour reproduire aussi des effets d’élévation : c’est la fameuse et presque délirante proposition d’un système 22.2 faite par Kimio Hamasaki de la NHK, lors du dernier Forum International du Son Multicanal, et qui positionne les enceintes selon un maillage spatial complètement enveloppant.
L’écoute stéréophonique traditionnelle au casque positionne quant à elle l’ensemble des sources sonores à l’intérieur du crâne, sur un axe passant par les deux oreilles. L’auditeur n’a donc pas de recul par rapport à la scène sonore, et sa profondeur n’est que difficilement perceptible.
Concentrons-nous maintenant, sur ce qui se passe à la surface de notre tympan, que nous soyons dans un environnement sonore naturel ou dans le champ produit par un système électro-acoustique. S’il on parvient à capter, au creux de l’oreille, les signaux complexes qui nous parviennent de sources ponctuelles situées à des endroits précis de l’espace et à les comparer avec les signaux initialement émis, on pourra alors recomposer la fonction de transfert globale du lieu d’écoute et de notre propre appareil auditif binaural. Ceci effectué, en transformant ensuite un son «naturel» en prenant en compte le filtrage réalisé par notre oreille externe et notre conduit auditif, on peut donner l’illusion à notre cerveau que ce son provient d’un point précis situé n’importe où dans l’espace, même si chaque oreillette du casque ne contient qu’un seul transducteur. C’est précisément ce que fait le Smyth Realiser.
La mise en oeuvre du système
Afin de reproduire de manière optimale, pour un auditeur donné, une véritable impression d’espace sonore, il convient donc de respecter le processus de calibration indiqué par le fabricant. L’auditeur insère une paire de minuscules microphones (fournis) dans l’amorce de son conduit auditif. Ces modèles sont de type omnidirectionnels et sont fabriqués par Knowles Acoustics, un des leader mondiaux du marché de la technologie micro-acoustique.
L’appareil, connecté aux entrées du préampli multicanal de l’installation, génère autant de salves de calibration qu’il y a d’enceintes acoustiques dans la pièce (caisson de grave y compris). Les microphones captent alors la réponse du système complet constitué du préampli, de l’ampli, des enceintes, de la salle, de la signature acoustique de l’oreille de l’auditeur, et ce voie par voie. Le Smyth Realiser A8 effectue alors ce que l’on nomme la déconvolution du signal issu des micros, c’est à dire l’extraction de la fonction de transfert de l’ensemble composé du système acoustique de la salle et de l’auditeur, et élabore des fichiers dits PRIR (pour «Person + Room Impulse Response») décrivant la réponse impulsionnelle du système. Un fichier PRIR associé à une salle et un utilisateur occupe 3 MOctet.
Pour garantir une restitution la plus fidèle possible, il convient également, dans un second temps, de calibrer l’ensemble constitué par le casque et les oreilles de l’auditeur, toujours avec les minis micros dans les oreilles. Il s’agit alors pour l’appareil de produire des fichiers nommés HPEQ (pour «HeadPhones EQualization»). Un fichier HPEQ propre à un modèle de casque et à son porteur représente 64 kOctet de données. Toutes ces opérations, qu’il faut évidemment mener dans une ambiance dénuée de pollution sonore afin de ne pas fausser les mesures, ne prennent qu’une poignée de minutes et sont entièrement automatisées. A noter que l’on peut aussi, grâce à un petit tour de passe-passe, émuler un système 7.1 de très haut niveau à partir de la seule capture d’un système 2.1 de qualité !
L’appareil, connecté aux entrées du préampli multicanal de l’installation, génère autant de salves de calibration qu’il y a d’enceintes acoustiques dans la pièce (caisson de grave y compris). Les microphones captent alors la réponse du système complet constitué du préampli, de l’ampli, des enceintes, de la salle, de la signature acoustique de l’oreille de l’auditeur, et ce voie par voie. Le Smyth Realiser A8 effectue alors ce que l’on nomme la déconvolution du signal issu des micros, c’est à dire l’extraction de la fonction de transfert de l’ensemble composé du système acoustique de la salle et de l’auditeur, et élabore des fichiers dits PRIR (pour «Person + Room Impulse Response») décrivant la réponse impulsionnelle du système. Un fichier PRIR associé à une salle et un utilisateur occupe 3 MOctet.
Le dispositif peut en théorie fonctionner avec n’importe quel casque. Il est évident néanmoins que meilleur est ce maillon, meilleure sera la «simulation» du système de reproduction. C’est ce qui permet au constructeur de parler de la recopie du système initial : non seulement de sa géométrie, mais aussi d’une bonne partie de ses qualités sonores intrinsèques (largeur de bande, dynamique, précision). Evidemment, la fidélité de cette recopie reste dépendante de la qualité des microphones fournis (qui sont remarquables pour leur taille), de la transparence des circuits du Realiser, et de la qualité du casque utilisé. Lors de l’écoute, le Smyth Realiser effectue l’opération dite de convolution, c’est à dire en quelque sorte l’habillage des signaux générés par un lecteur CD, DVD ou Blu-ray avec les indicateurs d’espace contenus dans les fichiers PRIR cités ci-dessus.
On connecte ensuite les entrées du Smyth Realiser aux sorties du préampli. L’écoute peut commencer.
A l’écoute
Lors de la session d’écoute réalisée à L’AFDERS, nous avions déjà pu constater l’efficacité du système, à partir d’une sélection de bandes-son de films et de programmes musicaux sur Blu-ray discs. Mais nous n’avions pu procéder à une phase de calibration personnalisée pour chaque auditeur. Du coup, l’écoute était réalisée avec des paramètres de salle et d’auditeur enregistrés en mémoire par Gilles Gérin, sur base du système 7.1. dont il dispose. Il fallait donc s’attendre à ce que l’illusion spatiale ne soit pas tout à fait complète.
Effectivement, autant la simulation des voies latérales et arrières était manifeste, autant l’on avait un peu de mal à percevoir les voies frontales comme véritablement placées à l’avant de l’auditeur. Un phénomène finalement assez compréhensible : comme nous l’avons vu plus haut, nos capacités de localisation sont étroitement liées à la conformation de nos pavillons d’oreille. Si celle-ci n’est pas exactement prise en compte, la perte en précision est importante, particulièrement dans les zones de plus grande sensibilité de notre système auditif, c’est à dire face à nous.
Effectivement, autant la simulation des voies latérales et arrières était manifeste, autant l’on avait un peu de mal à percevoir les voies frontales comme véritablement placées à l’avant de l’auditeur. Un phénomène finalement assez compréhensible : comme nous l’avons vu plus haut, nos capacités de localisation sont étroitement liées à la conformation de nos pavillons d’oreille. Si celle-ci n’est pas exactement prise en compte, la perte en précision est importante, particulièrement dans les zones de plus grande sensibilité de notre système auditif, c’est à dire face à nous.
La seconde écoute a donc été effectuée dans les locaux de l’importateur, qui dispose d’un système multicanal d’enceintes françaises GKF à haut rendement (pack SVIP 1000 et SVP 200) complétées par un caisson de grave Triangle et d’un salon optimisé à l’aide de panneaux de traitement acoustique de marque Cine-Panels. La lecture de CD, DVD et Blu-ray est confiée au lecteur Oppo 93 et l’amplification à un gros intégré Denon AVR 4311. Une installation plutôt orientée Home Cinema, le traitement acoustique mis en oeuvre contribuant à rendre la pièce d’écoute plutôt neutre et mate. Pour l’écoute du Realiser, un beau casque Stax SRS 2050 mkII et son amplificateur dédié sont utilisés.
Une fois réalisées la double calibration du système (enceintes et casque) et l’activation du système de suivi de tête, nous passons immédiatement à l’écoute d’une petite séquence musicale contenue dans la mémoire du Smyth Realiser. Sur cette séquence, l’illusion d’une diffusion sur les haut-parleurs existants est tout à fait spectaculaire. Comme de nombreux autres utilisateurs avant moi, je ne peux m’empêcher de demander à Gilles Gérin de couper le son des enceintes tout en retirant le casque. Mais je n’ai pas le temps de terminer ma phrase… les enceintes sont bien silencieuses !
Cette illusion parfaite se poursuit quel que soit le type de programme écouté : extraits musicaux sur CD et SACD, bandes son de plusieurs films en Blu-ray (écoutées «à l’aveugle» afin de ne pas être influencé par l’image). J’avais pris soin d’emporter quelques un de mes CD fétiches, afin de tester en premier lieu la capacité du système à reproduire deux canaux stéréo frontaux. Je constate ainsi qu’Emmanuelle Bertrand et son violoncelle sont focalisés de manière très satisfaisante bien devant moi, entre les enceintes frontales virtualisées par le Realiser A8. Sur l’enregistrement public de Michel Portal à Minneapolis, la scène sonore de déploie devant moi, et semble de nouveau bien située au niveau du plan des enceintes, en offrant l’assise et la profondeur que je connais de cet enregistrement. Non seulement l’illusion géométrique est bien là, mais il n’y a pas de hiatus notable entre l’écoute au casque et l’écoute sur les enceintes sur le plan de la largeur de bande subjective, de la dynamique ou de l’effet d’espace apporté par la pièce elle-même.
Sur plusieurs programmes multicanaux (le dernier SACD d’Eric Bibb, ou encore la bande son de «L’Age de glace»), je passe ensuite en revue chacun des transducteurs «fictifs» ou canaux virtuels récréés au casque par le Smyth Realiser A8, grâce à la télécommande très pratique de l’appareil.
Le résultat est bien là : les canaux latéraux et arrières (légèrement surélevés en pratique) sont eux aussi précisément localisés dans l’espace. Lors de l’écoute avec tous les canaux en service, la sensation d’enveloppement est totale, et il devient alors très difficile de localiser les canaux virtuels… Ce qui est finalement une bonne chose. Car ce que l’on vise, avec la stéréophonie et a fortiori avec une installation multicanal, c’est bien l’effacement des enceintes - autant que faire se peut - devant le phénomène sonore à reproduire. Quant au canal LFE («Low Frequency Effects»), la voie grave dite «.1» du home cinéma, il est reproduit avec une autorité et une consistance assez inimaginables pour une écoute au casque ! Le système de suivi de tête, clipsé sur le sommet du casque, assure de son côté une stabilité indéfectible de l’image sonore, ce qui contribue largement au confort de l’écoute et à la vraisemblance de la virtualisation. La liberté de l’auditeur est donc quasi totale, sans production d’artefacts gênants lors des mouvements de la tête. L’incroyable pari des frères Smyth semble tenu !
Le résultat est bien là : les canaux latéraux et arrières (légèrement surélevés en pratique) sont eux aussi précisément localisés dans l’espace. Lors de l’écoute avec tous les canaux en service, la sensation d’enveloppement est totale, et il devient alors très difficile de localiser les canaux virtuels… Ce qui est finalement une bonne chose. Car ce que l’on vise, avec la stéréophonie et a fortiori avec une installation multicanal, c’est bien l’effacement des enceintes - autant que faire se peut - devant le phénomène sonore à reproduire. Quant au canal LFE («Low Frequency Effects»), la voie grave dite «.1» du home cinéma, il est reproduit avec une autorité et une consistance assez inimaginables pour une écoute au casque ! Le système de suivi de tête, clipsé sur le sommet du casque, assure de son côté une stabilité indéfectible de l’image sonore, ce qui contribue largement au confort de l’écoute et à la vraisemblance de la virtualisation. La liberté de l’auditeur est donc quasi totale, sans production d’artefacts gênants lors des mouvements de la tête. L’incroyable pari des frères Smyth semble tenu !
Conclusion
Le Smyth Realiser A8 est à la fois une prouesse technologique et un appareil qui procure un plaisir d’écoute indéniable. Cet exploit a un prix, qui n’est pas exagéré compte tenu de la puissance de cette petite boîte noire. Le fait est qu’avec cet appareil, on peut pratiquement se passer de système home-cinema, pourvu que l’on ait la possibilité de mener à bien et en personne une phase de calibration soignée face à un système existant. Cela dit, je doute fort que les revendeurs de beaux matériels audio ouvrent grandes leur portes aux amateurs équipés d’un Smyth Realiser ! Mais si votre richissime ami d’enfance vous laisse approcher son système d’exception la prochaine fois qu’il vous invite, rien ne vous empêche de repartir avec une copie virtuelle de son système et de vous faire plaisir à moindre frais.
Cet appareil n’est pas qu’un très beau gadget bien doté par ses concepteurs. C’est aussi un outil de travail tout à fait efficace qui permet aux ingénieurs du son, aux mixeurs, au monteurs ou aux ingénieurs de mastering de peaufiner un mixage sans devoir réserver un coûteux studio de longues heures durant. Une bonne partie de la clientelle d’AV-in est d’ailleurs constituée de ce public. Il peut aussi servir à mettre au point un dispositif de reproduction sonore spécifique, pour une expérience ou un spectacle par exemple. Record en la matière : la commande 3 appareils en une seule fois, par un technicien son qui souhaitait pouvoir faire du contrôle de diffusion sonore «holographique» avec un système à 24 canaux (la superposition et la synchronisation de plusieurs systèmes est en effet possible).
On regrettera juste que le SVS Smyth Realiser A8 ne présente pas d’entrée numérique, ce qui aurait évité de recourir à la version analogique d’un signal multicanal avant le (nécessaire) traitement numérique complexe qu’il réalise. Cela étant, l’étage de conversion analogique/numérique de l’appareil est d’une transparence suffisamment poussée pour que cela ne soit pas un réel problème. Le Realiser présente en revanche une sortie numérique au format sp/dif. Elle pourra servir, après une compression éventuelle, à préparer des fichiers son stéréophoniques exploitables par un balladeur numérique. Ce qui permettra de profiter, tout en faisant son jogging, d’un son multicanal au casque...
SVS Smyth Realiser A8
- 8 entrées analogiques (7 + 1 canaux) niveau ligne sur connecteurs Cinch (écoute), conversion sur 24 bits à 48 kHz,
- 8 sorties analogiques niveau ligne sur connecteurs Cinch (phase de calibration),
- deux sorties casque sur Jacks 6.35, suréchantillonnées à 192 kHz avant conversion N/A,
- sortie numérique optique sp/dif (16 bit / 48 kHz) sur connecteur TOSLink,
- sortie supplémentaire pour alimentation d’un système Sensurround,
- ports USB pour le dispositif de suivi de tête,
- slot pour carte mémoire au format SD,
- afficheur LCD micro-pixel 4 lignes,
- LEDs de contrôle des canaux en service,
- alimentation par boîtier séparé,
- dimensions : 22 x 10 x 17,5 cm.