コーデックから知るDolby Atmos再生環境 〜【第21回】DIYで造るイマーシブ・スタジオ 古賀健一

 最大128trのDolby Atmos音声は、どのような形になってリスナーの耳に届くのか? 音を作って“はい、終わり”ではなく、きちんと理解したいと思っていました。しかし、中間ファイルを扱うレコーディング・エンジニアという職業のため、正直、この辺りの最終コーデック(どういうプログラムを使って圧縮/変換/復元するか)についての知識が乏しいと自分で感じていました。コーデックとは? コンテナとは? Dolby Digital Plusとは? 昨年Apple Musicで空間オーディオが始まり、さまざまなトラブルに見舞われる中、多くの方々とやりとりする機会が増え、その会話に全くついていけない、自分の知識の無さを痛感したことが見直すきっかけでした。

E-AC-3 JOCかAC-4 IMSかで生じた再生環境におけるさまざまな違い

 Official髭男dismのアルバム『Editorial』などを仕上げていた昨年、調べても英語の情報も少なく、日本語の情報は全くない中、偶然、Twitterで井戸水さん(@idomizu_)のブログ記事を見つけました。

「音楽サブスクはどのように空間オーディオを提供しているのか」

 この記事を見たとき、これはすごい世界だと思い、ドキッとしました。早速井戸水さんにコンタクトを取り、今もDolby Atmosに限らず、Android端末や360 Reality Audioのことなど、情報を共有させてもらってます。そんな彼に今回は協力してもらい、このコラムを書いています。

 まず、皆さんが最終的に聴いているDolby Atmos Musicファイルのコーデックとしては、Apple MusicではE-AC-3 JOC、Amazon MusicとTIDALではE-AC-3 JOCとAC-4 IMSでエンコードされています。

 ACとはオーディオ・コーデック(Audio Codec)の略。AC-3はそのVer.3、AC-4はVer.4という意味です。E-AC-3の“E-”とはEnhanced(拡張)のことで、またの名をDolby Digital Plus、さらに略してDD+とも呼びます。ほかにもいろいろな呼び方があるのがとてもややこしいです。

 しかし、このE-AC-3=Dolby Atmos音声というわけではありません。E-AC-3は開発時、拡張性を持たせた空きスペースがありました。そこにDolby Atmosのために必要な差分情報を持たせたものが、Dolby Digital Plus JOC(DD+ JOCとも)と呼ばれるフォーマットです。E-AC-3 JOCと表記されることもあります。

 実際にDolby Atmos Rendererで作成したMP4ファイルをMEDIAAREA MediaInfoというアプリケーションに取り込むと、E-AC-3 JOCと表示されます。

MEDIAAREA MediaInfoというアプリケーション(Mac App Storeで購入可能)に、Dolby Atmos Rendererで書き出したMP4ファイルの情報を見る(ADM BWFでない点に注意)。フォーマットがE-AC-3 JOC=DD+ JOCである点に注目してほしい

MEDIAAREA MediaInfoというアプリケーション(Mac App Storeで購入可能)に、Dolby Atmos Rendererで書き出したMP4ファイルの情報を見る(ADM BWFでない点に注意)。フォーマットがE-AC-3 JOC=DD+ JOCである点に注目してほしい

MediaInfo

MediaInfo

  • MediaArea.net
  • ユーティリティ
  • 無料

 次にAC-4。こちらはDolby AC-4という、最新の圧縮技術を盛り込んだロッシー(Lossy:非可逆圧縮)音声です。圧縮効率はDolby Digitalの2倍ほど。つまりデータ容量を抑えたい携帯などの音楽配信に向いていることが分かります。“IMS”とはヘッドフォンやスマートフォンのステレオ・スピーカー用に開発された技術で、Dolby Atmos Rendererで入力したバイノーラル・エンコードのメタデータ(Near/Mid/Far)が反映できるフォーマットです。

 よって、現在のApple Musicがバイノーラル・エンコードのメタデータを反映できない理由は、AC-4 IMSではなく、E-AC-3 JOCを使ってるからだということが分かります。Apple Musicの採用するE-AC-3 JOCでバイノーラル・エンコード情報が反映されないのはどうしてなのか? この辺りは憶測もあるので、正解を断言できませんが、Dolby Atmos Homeが始まった当初、制作者側でヘッドフォン再生時のパラメーターを調整するという考え自体が、無かったからではないかと推察しています。

井戸水さん提供の資料より、配信サービスと採用コーデックの一覧

井戸水さん提供の資料より、配信サービスと採用コーデックの一覧。Amazon MusicとTIDALが携帯端末とオーディオ機器への出力でAC-4 IMSとE-AC-3 JOCを使い分けているのに対し、Apple MusicはE-AC-3 JOCのみとなっている。各コーデックの下は、デコードをハードウェア(スマートフォンやタブレット本体)で行っているか、ソフトウェア(アプリ内)で行っているかについて記したもの

 Amazon MusicやTIDALはスマホやタブレットにAC-4 IMSで配信しています。Amazon MusicにおいてはAC-4 IMSの音声をすべてアプリ内で処理してしまうため、Dolby Atmosに非対応なAndroid端末、Dolby Atmosには対応していてもAC-4 IMSには対応していないiPhone/iPad、古めのAndroid端末などにおいても、Dolby Atmosを楽しむことができます。

 一方Amazon MusicのE-AC-3 JOC音声は、SONOSのサウンド・バーや、Amazon Echo Studioなどのスマート・スピーカー用となっています。

電波状況によって音声ビットレートは大幅に変化する

 次はコンテナについて解説します。コンテナとは、その名の通り箱。例えば、Apple MusicのDolby Atmos音声ファイルは、MP4コンテナに入れた上で、HLS(HTTP Live Streaming)によるMPEG-4で配信されています。

 MP4コンテナとは、MPEG-4規格の一部としてできた、動画や音声などを記録するためのファイル形式(コンテナ・フォーマット)の一つ。MPEG-4動画の記録に使うことが多いですが、データの“入れ物”なので、音声のみを収納することもできます。

 そうするとDolby Atmos RendererでADM BWFから作成される.mp4は“MP4という箱の中に、E-AC-3 JOCという音声ファイルが入っている”ことになります。ちなみに一緒に入っている真っ黒の動画のコーデックはAVCでした。

 音声圧縮についても軽く触れておきましょう。ちょくちょく登場しているロッシー。MP3やAACなどと同様に、聴覚にあまり影響の無い(とされる)音を削り取っています。一度失ったものは二度と戻ってくることはありません。逆に、元に戻せる音声をロスレス(可逆圧縮)と呼びます。

 さて文字数も無くなってきましたので、最後の用語、ビットレート。これは単位時間あたりのデータ量のことです。単位はbps(bit per second)が用いられることが多く、これは1秒あたり何ビットであるかを表します。動画のビット・レートは、映像と音声に分けられますが、僕らが気にするのは音声ビットレート。Amazon MusicとApple Musicでは、E-AC-3   JOC音声は448~768kbpsで配信されています。かなり幅がありますね。また、Amazon MusicのAC-4 IMS音声は112~256kbps。ビットレートに関しては、ネットワーク状況やユーザーの音質設定などに合わせて切り替えられます。

 本当はDolby TrueHDとか、ビット・ストリーム出力とか、360 Reality AudioのMPEG-Hとかにも触れたかったのですが、今回はここまで。僕もとても勉強になりました。難し過ぎる内容なので、続編希望の方は教えてください(笑)。

 

古賀健一

古賀健一

【Profile】レコーディング・エンジニア。青葉台スタジオに入社後、フリーランスとして独立。2014年Xylomania Studioを設立。これまでにチャットモンチー、ASIAN KUNG-FU GENERATION、Official髭男dism、ichikoro、D.W.ニコルズなどの作品に携わる。また、商業スタジオやミュージシャンのプライベート・スタジオの音響アドバイスも手掛ける。
Photo:Hiroshi Hatano