バイノーラルと音楽:飛澤正人が語る「音楽を進化させる2.5次元ミックス」〜特集・バイノーラルで作る音楽の未来(5)

f:id:rittor_snrec:20201105200758j:plain

2ミックスと3Dミックスの良いところ取りで
音楽が次のステップへ進化するのではないでしょうか

 飛澤正人氏は、数年前から立体音響やバイノーラルについて日夜研究を重ねてきた熟練のエンジニアだ。ここでは2019年末に完成したという彼の最新技術=8Way Reflectionを開発することになったいきさつや、それを交えたミックスの話などを聞いてみよう。

Photo:Hiroki Obara(exept*)

 

2016年のVR元年に
バイノーラルが表舞台に登場しなかった理由

 飛澤氏がバイノーラルのサウンドを初めて聴いたのは、1980年代半ばのことだという。

 

 「ある日、スタジオにバイノーラル音源が届いたのでヘッドフォンで聴いてみると、チョキチョキというはさみを動かす音が頭のすぐ近くで鳴るような体験をし、とても衝撃を受けました。“2ミックスでこんな表現できるの?”と思った記憶があります。当時は既にダミー・ヘッド・マイクのNEUMANN KU100は発売されていたと思いますね」

f:id:rittor_snrec:20201105201049j:plain

飛澤氏が試験使用したバイノーラル録音用ダミー・ヘッド・マイクNEUMANN KU 100。音響研究での測定装置としても使用されており、内部にはオン/オフ可能な−10dBのプリアッテネーション・スイッチやローカット・スイッチを備えている。周波数特性は20Hz〜20kHz(*)

 それから飛澤氏が再びバイノーラルに興味を持ったのは、“VR元年”と言われた2016年ごろだそう。

 

 「2016年辺りはVR(Virtual Reality)という言葉が出てきて、360°カメラが発売され、映像の世界では大変革が起きた印象があります。そんな中、“音はどうだろう?”と思ったのです。僕の記憶では、そこでバイノーラルが脚光を浴びたかというと、そうではなかったんですよ。映像だけ進化して、音は置いてけぼりにされた感じでした」

 

 VR元年に音も一緒にアップデートしなかった原因には、いろいろな要素があったと飛澤氏は推測する。

 

 「そもそもバイノーラルには位相変化が伴うのですが、1970〜80年代はアナログ・レコードが主流。レコードでは、逆位相が加わると針が飛んでしまうのです。だから僕たちエンジニアは、オシロスコープを見ながらできるだけ逆相が入らないようにミキシングしていました。その後、メインの媒体がレコードからCDに移行するのですが、そのときもバイノーラルは表舞台に出てこなかった印象があります」

 

 飛澤氏は、音源がデジタル化したときに人々が注目したのは、当然だが位相ではなくハイファイなサウンドだったという。

 

 「レコードにあったヒス・ノイズやスクラッチ・ノイズが無くなり、CDのクリアな音質に皆が驚いたのです。そちらの方に意識が向いたから、バイノーラルはいつの間にか忘れられてしまったようなところがあると思います。もう一つ、HRTFの問題が大きかったのかもしれません。ダミー・ヘッドでの収録やHRTFで畳み込まれたバイノーラルの音は、ある人にはすごく立体的に感じられても、ある人は全然感じないということが起きます。それもバイノーラルが大きく製品化されなかった理由の一つでしょう。だから、VR元年のときもバイノーラルは表舞台に登場しなかったのかもしれません」

 

日本の住宅事情では難しい
サラウンド・スピーカーの設置

 2000年代以降になると、自宅でサラウンド再生を楽しむようなスピーカーも数多く発売されるようになってきたが、それについて飛澤氏はこう話す。

 

 「やはりスピーカーをたくさん設置しなければいけないので、物理的に手間がかかります。特に音楽を聴く若者たちの層は狭いアパートに住んでいる人も多く、設置が大変だし、夜に音楽を楽しもうと思ってもサラウンドで音を出せる環境の人はあまり居ないでしょう。特に日本の住宅事情では厳しいと思います」

 

 そこでどうしたらよいか、次なる一歩を飛澤氏が考え始めたのが、2016〜17年ごろだという。

 

 「2chで立体音響を聴かせるためには、やはりバイノーラルが必要だというところに行き着きました。それからダミー・ヘッドを含めたあらゆるバイノーラルに関するツールを試してみたのです。その結果、現状のツールでは高い精度で立体音響を再現するのは難しいという結論に達しました。そこで今度は自分のミキシング技術で何とかその精度を高められないかと試行錯誤し、2019年の末に8Way Reflectionという方式を完成させました」

 

やはりバンドのパートは
これまで通り頭の中で鳴っててほしい

 今回、飛澤氏には、実際にバイノーラル技術を交えてミックスした曲について解説していただくことに。

 

 「楽曲は、作編曲家の成田勤氏を中心に結成されたバンド=Stella Magnaの「セフィラへ(feat.CHiCO)」(『STELLA MAGNA -Songs from GRANBLUE FANTASY-』収録)。このアルバムのミックスは僕が手掛けていて、すべての楽曲にバイノーラル処理を使っています。中でもバイノーラル処理が一番分かりやすいと思ったのが、この「セフィラへ(feat. CHiCO)」でした」

STELLA MAGNA -Songs from GRANBLUE FANTASY- (Original Soundtrack)

STELLA MAGNA -Songs from GRANBLUE FANTASY- (Original Soundtrack)

  • Stella Magna/グランブルーファンタジー
  • サウンドトラック
  • ¥2444
RPG『グランブルーファンタジー』のサウンドを担当する成田勤が率いるバンドの1stアルバム。バンド・サウンドを軸に、すべての楽曲において8Way Reflectionとバイノーラル処理が使われている

 この曲は4分強の長さのインストゥルメンタル。シンセ・パッドやSE、パーカッションから始まり、途中から重たいロック・サウンドと女声コーラスが加わるという展開になっている。飛澤氏へ、全体的なミックスのイメージを聞いた。

 

 「簡単に言うと、ドラムやベース、ギターやボーカルなど、基本的なバンドのパートは普段通りの2ミックス=ヘッドフォンでは頭内定位で処理し、冒頭から鳴っているメタリックなパーカッションやシンセ・パッド、SE、そのほかバンド以外のすべてのパートは頭外定位で処理しています。やはりバンドのパートは、これまで通りヘッドフォンをした頭の中で鳴っていてほしいと思ったのです。ちなみにバンド以外のパートは3D空間を感じさせようとするために頭外定位しているわけではなく、楽曲にさりげなく彩りを与えるようなイメージで配置しています」

 

 飛澤氏は、以前バンドのパートもバイノーラル処理を施して頭外定位で鳴らしてみたことがあるのだそう。

 

 「皆を驚かそうと思ってやってみたのですが、どうしても遠くで鳴っている感じになるため、楽曲自体の説得力が減ってしまったように感じました。ロック系のバンド・サウンドにはあまり合わなかったのかもしれません。やはり音源すべてを完全にバイノーラル再生してしまうと、作品によっては“届きにくい”ということがあるかと思います。また、リスナーがスピーカーで聴いた場合に、“なんか音が遠くない?”という印象を持つ可能性もあり、それはかなりリスクがあります。ですので、僕はこれまでの2ミックスと3Dミックスの良いところをうまく組み合わせることで、音楽が進化するのではないだろうかと考えているのです。私はこれを“2.5次元ミックス”と呼んでいます」

 

音源に1〜15msほどの短いディレイを付加すると
“位相変化”が起きる

 各パートの録音について、飛澤氏はこう話す。

 

 「ドラムやベース、ギター、ボーカルはレコーディング・スタジオで普通に録音し、メタリック・パーカッションやシンセ・パッド、SEなどバンド以外のパートは、アレンジャーの成田氏から送られてきたデータを使用しました。また頭外定位させたバンド以外のパートには、僕が開発したミキシング技術8Way Reflectionを使っています。この技術の画像やより具体的な詳細については製品化までお伝えできませんが、今後この技術をプラグイン化してリリースする予定です」

f:id:rittor_snrec:20201105201730j:plain

飛澤氏の考案したミキシング技術8Way Reflectionのイメージ。前後左右の4方向をさらに上下2層に分けることでできる、合計8方向の反響音をディレイでコントロールすることにより、3D空間をより鮮明に表現できる方法

 ここで飛澤氏に、8Way Reflectionの開発に至った経緯を伺った。

 

 「現在リリースされている3Dパンナーやバイノーラル・プロセッサー/デコーダー・プラグインをいろいろ使ってみましたが、なかなかリアルな立体空間を再現できませんでした。その主な原因として挙げられるのはHRTFの問題。耳の形や頭、肩などの形状の違いによってHRTFは十人十色であるため、一般的なダミー・ヘッドで計測したHRTFを用いても、人によっては全く立体的に聴こえないということが起こるのです」

 

 空間をステレオで再現するためには、HRTFを使って畳み込むことが必須であり、このHRTFの問題を解決しない限り、ヘッドフォン再生での立体音響の普及は困難であると飛澤氏は語る。

 

 「その対応策として、近年ユーザーが自分の耳をカメラで撮影し、膨大なプロファイルの中から個人に適合するHRTF を再構築するシステムも実用化されていますが、手間がかかることに加え、コンテンツ自体がとても少ないため、普及は難しいでしょう」

 

 そこで飛澤氏は、HRTFの問題を“ミキシング技術”で解決できないかと数年間をかけて研究したという。

 

 「単音/和音にかかわらず、楽器や声などの音源に1〜15msほどの短いディレイを付加すると“位相変化”が起きるのですが、これを利用して前後左右の4方向×上下2層に分けてできる合計8方向の反響をコントロールすれば、より鮮明に空間を表現できるとひらめいたのです。8Way Reflectionでは、合計16個のディレイが3D空間の位置情報を正確にサポートするよう設計されており、それらが音源の位相を変化させることによって、HRTFに大きく左右されずに360°の定位感を認識させることを可能にしました。それは、複数の被験者のフィードバックにより明らかとなっています」

 

AUDIO EASE 360Monitorに搭載された
複数のHRTFを使い分ける

 飛澤氏の考案した8Way Reflectionが、「セフィラへ(feat.CHiCO)」に登場するシンセ・パッドやSE、パーカッションなどに使用されているとのことだが、実際どのようなプロセスが成されているのだろうか?

 

 「まず、成田氏から届いたオーディオ・ファイルをAVID Pro Toolsのセッション・ファイルへ流し込みます。Pro Tools|HD 12.8.2 Software以降には、FACEBOOK 360 Spatial Workstationというプラグイン・バンドルが付属していますが、ここではそのバンドルに収録された3Dパンナー・プラグインSpatialiserを後ろに定位させたいトラックへインサート。ここではパーカッションを左後ろ−135°と右後ろ135°に配置しています。なお、上下の高さはどちらも0°です」

f:id:rittor_snrec:20201105201918j:plain

FACEBOOK 360 Spatial Workstationというプラグイン・バンドルに収録された3Dパンナー、Spatialiser。画面ではLch側の信号(画面内の①)を−135°、Rch側の信号(同②)を135°に配置。飛澤氏は頭外定位させたいソースを、このプラグインを使っていったん3次Ambisonicsへと変換する

 Spatialiserを通った後、音源は3次Ambisonicsにエンコードされてバスへと送られるが、同時に飛澤氏はセンド&リターンで8Way Reflectionへも送っているそうだ。

 

 「8Way Reflectionでは、音源の位置情報に反応して処理が施された後、バスに送られます。そこで原音と音響合成し、位相変化を起こすのです。バスでまとめた後はバイノーラルに変換するのですが、このとき僕はAmbisonicsによる立体音響制作プラグイン・バンドルAUDIO EASE 360Pan Suiteに収録されている360Monitorを使いますね。360Monitorは360°VR映像の視聴角度に合わせてミックスを試聴でき、さらにAmbisonics方式からバイノーラル方式への変換も行えるプラグインです」

 

 飛澤氏いわく、「ここでのポイントは、360Monitorの画面右下にあるプルダウン・メニューから、数種類のHRTFを選べるところです」とのこと。氏はこう続ける。

 

 「普段、頭の後ろ側に音源を配置する際は“Google, Headphones(third order KU100)”を選択しています。理由は、後頭部側における定位の再現力が一番高いと思うから。このことは“一番僕の耳に合っている”とも言えるので、他人の耳でもいろいろ試してみました。その結果、やはり“Google, Headphones(third order KU100)”に設定したときに、ほとんどの人が“音が後ろ側にあるように感じる”と言ったので、現在はこれを選んでいます」

f:id:rittor_snrec:20201105202112j:plain

AUDIO EASE 360Monitorは、360°VR映像の視聴角度に合わせて音声をモニターすることができるプラグイン。1〜3次Ambisonicsを、2chのバイノーラルなどへ変換することができる。飛澤氏は360 Spatial Workstationと8Way Reflectionで3次Ambisonicsにした頭外定位音源を、画面右下にあるプルダウン・メニューにある、数種類のHRTFを音源の配置場所によって使い分けている

 ここでもう一つ、飛澤氏は360Monitorの内蔵HRTFについてこう付け加える。

 

 「このプルダウン・メニューから、“Audio Ease, Headphones(third order KU100)”を選択すると、今度は上下における定位の再現力が一番高く感じます。そのため、音源を後頭部側に配置したいときは先ほどの“Google, Headphones(third order KU100)”を用い、上下に配置したいときは“Audio Ease, Headphones(third order KU100)”を使用する、という具合で使い分けをしているのです

 

 こうしたミックスでの3次元定位には、実音に加えてディレイ音の定位もポイントとなるそうだ。

 

 「冒頭のメタリック・パーカッションは左右にパンを振っていて、それにかけたディレイは頭の後ろで鳴っています。またボーカルは正面に配置されていますが、ボーカルに施したディレイも頭の後ろで鳴るように配置しているのです。こうすることによって、正面や左右で鳴った音が、自分の耳を通り抜け、頭の後ろ側の空間に広がっていくような感覚を体験することができるでしょう。2ミックスの場合、ディレイは奥に消えていきますよね?ですが、バイノーラル技術によって空間が頭の後ろ側にも広がるため、正面で鳴った音のディレイを後頭部の空間に飛ばすということも可能になるのです」

 

より機能的かつ臨場感のある配信や
コンテンツ制作が可能に

 最後に、飛澤氏へ今後のバイノーラルについて話を聞いてみた。

 

 「まずはポップスなどの音楽だけではなく、もっともっと広い範囲における“音の進化”が必要だと思います。ですので、ゲーム業界や放送業界などがバイノーラルと僕の8Way Reflection技術を取り入れれば、より機能的かつ臨場感のある配信やコンテンツ制作が可能になるでしょう。例えば、野球やサッカーなどスポーツの試合中継などの配信では、観客の歓声を頭外定位に置き、実況の声は頭内定位でセンターに置くといったことが考えられます」

 

 飛澤氏いわく、“音楽に関しては従来の2ミックスにバイノーラルと8Way Reflectionを融合するスタイルが望ましいでしょう”とのこと。氏はこう続ける。

 

 「やはり、これまでの2ミックスでの音作りを残しつつ、パッド・シンセやSE、空間系エフェクトの音などは頭外定位で鳴らすというような、僕が提唱する“2.5次元ミックス”が心地良く聴けるのではないかと考えています。すべての音を無理矢理立体的にするのではなく、2ミックスと3Dミックスの“良いところ取り”が理想的です」

 

 現在コロナ禍で、人々がライブやコンサート会場に行きにくくなったことを受けて、飛澤氏はこのようなことを考えているという。

 

 「皆さんが会場に行けない分、ライブのストリーミング配信で臨場感のある音楽体験をヘッドホンやイヤホンで再現できるようにしたいと思っています。例えば正面でギターが鳴って、その音が会場の後ろ側で反響するといったことも、「セフィラへ(feat.CHiCO)」で用いたボーカルの音作りや、オーディエンス・マイクを頭の後ろ側に定位させることで再現可能です。こういった体験がこれまでのヘッドフォンで楽しめるというのは、コンテンツ自体としても魅力的ですね。現在、あるラジオ局も僕の8Way Reflectionを使ったバイノーラル技術にとても興味を示してくださっているので、これからが楽しみです」

 

PENTANGLE STUDIO

f:id:rittor_snrec:20201105202336j:plain

飛澤氏が拠点とするPENTANGLE STUDIO。2017年、立体音響の研究をするためにこのスタジオを造った。FOCAL CMS50を5台設置し、5.0ch対応のスピーカー・システムを備えている。メイン・モニターはB&W Signature 805(黄色いコーン)で、オーディオI/OはDIGIGRID DigiGrid IOS-XLを使用

f:id:rittor_snrec:20201105202400j:plain

ヘッドホンに取り付けて使用するデバイス、WAVES NX Head Tracker。専用アプリケーションをインストールしたMac/WindowsやAndroid/iOSデバイスとBluetoothで接続することにより、頭の位置情報がリアルタイムに送信される。これにより、ヘッドホンで3Dオーディオやチューニングされた部屋の音響を体験可能

f:id:rittor_snrec:20201105202421j:plain

モニタリング用のヘッドホン。左からメインで使用する密閉型のSHURE SRH1540、開放型のAKG K812、密閉型のAKG K872、開放型のFOCAL Utopiaが並んでいる

 

飛澤正人

【Profile】Dragon Ash、HYなどの作品を手掛けてきたエンジニア。VRやサラウンドに対応したPENTAGLE STUDIOを設立し、2ミックスでは表現できないサウンドを追求している

 

【特集】バイノーラルで作る音楽の未来

www.snrec.jp

www.snrec.jp

www.snrec.jp

www.snrec.jp

www.snrec.jp

 

関連記事

www.snrec.jp

www.snrec.jp

www.snrec.jp

www.snrec.jp