Music TO GO!

2014年12月08日

Meridianの新音楽フォーマット、MQAを考える(2) - 四角を三角に置きかえる

Meridianの新音楽フォーマットであるMQAについてですが、Realhd-audioサイトによくまとまった記事がありました。
http://www.realhd-audio.com/?cat=45

これによると、MeridianのRobert Stuart(音展に来ていたボブ・スチュワート)、Peter CravenによるAESの研究発表である"A Hierarchical Approach to Archiving and Distribution"がベースで、これを商業的にブランド化したのがMQAということです。A Hierarchical..については下記リンクです。
http://www.aes.org/e-lib/browse.cfm?elib=17501

いまでもたくさん音源形式があるのに、MQAの利点は何かというと、これはすでにMeridianサイトで上がっていますが「音質と利便性の両方をトレードオフなしに向上する」ということです。簡単に言うとロスレスなのにサイズを小さくできるということです。具体的には96kHz/24bitの4.8Mbps相当のデータをCD品質(1.4Mbps)より小さい1Mbps低度にできるというところです。
同時にいまのところ一番のMQAの疑問は4.8Mbpsある96kHz/24bitのデータ量を、品質を落とさずに1MbpsというCD(44/16)の1.4Mbpsよりさらに小さい1Mbpsというデータ量にするという点です。単にロスレス圧縮してもいいところ50%なのでそこまでは小さくならないでしょう。ですからMQAはなんらかのLossyではないかと言われてますし、私はアダプティブのような形式じゃないかと推測しました。

ここで下記Realhd-audioリンクページの図(Fig1)を見てもらいたいと思います。
http://www.realhd-audio.com/?p=3861

Fig1は96kHz/24bitのある音源の強度分布を示すグラフです。音の強度はdBで縦軸に示しています。横軸はサンプリング周波数で96khzのナイキスト周波数の48kHzまでプロットされています。

これをみるとわかるように、サンプリング周波数が高くなるにつれて、音の情報(強度)が少なくなっています。しかしながらデータは常に96kHz、24bitの"容量"が使われているわけです。つまりCD品質の周波数帯域では音はみっちりはいっているけど、それより上はスカスカなわけです。それでも容量は食っています。

ハイレゾ音源ってスカスカなのか、という話はとりあえず置いといて、
つまり4.8Mbpsが1Mbpsになるマジックは「ある情報(Signal Area)は捨てない」けれど、「ない情報(No Signal present)は捨ててる」わけです。これを非可逆(lossy)というか可逆(lossless)というかはたしかに微妙ではあります。捨てている、というのは語弊がありますが、おそらくは22kHz以上の部分については必要なdBの分だけ割り当てる、つまり録音したマスターが24bitデータであっても22kHz以上については24bit使ってないからいらないじゃん、必要なビット数のみ割り当てればよいでしょう、ということではないかと思います。たとえば、Fig1で44kHzあたりでは実質30dB程度しかダイナミックレンジが必要ないとすれば、ここはビット数は5bitあればすみます。つまり19bit分は節約できるという理屈ではないかと思います。
後で出てくる互換性のため必要なのは16bitですから、おそらく22kHz以下でも17-24bitはなんらかの圧縮をしているのかもしれません。

これによって見たところ4.8Mbpsの半分は軽くできるので、約2Mbps強になって、1:2低度は可逆圧縮できるので、1MbpsのCD品質くらいのデータ量に収まるということなんでしょう。このことを上記記事リンクのタイトルでは「四角を三角に置きかえる」と書いてます。(図のデータ部分"Signal Area"が三角形だから)

MQAのエンコード(カプセル化)では、音源ファイル(ここでいうコンテナ)ではまずCD相当のデータが普通にはいっていて、あるメタデータを読まなければそのまま普通の音源ファイルとして再生するんでしょう。つまり前方互換性があります(従来システムでもMQAが読めるということ)。
MQAではメタデータのどこかの部分に拡張差分データ(オリジナルデータ 引くところの CD相当データ)をMQAエンコード(四角を三角)にしたものがはいっていて、メタデータにある情報をたよりにそれをデコードして、CD相当データと合わせてオリジナルデータに戻すんだと思います。
この辺はオリジナルデータ→MQAエンコード→MQAデコードでバイナリ比較するとどうなんでしょうかね。

CD品質とハイレゾ部分のデータが差分・階層的という点ではアダプティブっぽいですが、それよりはむしろハイレゾ版のHDCDに近い感じの基本部分と拡張部分に分かれたものに見えますね。つまりHDCDを普通のCDプレーヤーで再生できるように、MQAは普通のDACで再生するとそのままPCM部分が読めて、さらにそのメタデータを認識できるデコーダならば、ハイレゾの拡張部分を元に戻せるということなんでしょう。
MQA対応したMeridianの新型ExplorerではDSPを使っていると言いますが、おそらくPCやスマートフォンのソフトウエアならもっと効率的にデコードできると思います。

なおMQAについては関連特許を探した人がいて、特許内容があります。これを見てもよくわかりませんが、うちのブログは玄人の人がたくさん見ているのでリンクをあげておきます。
http://patentscope.wipo.int/search/docservice_fpimage/WOGB2013051548@@@false@@@en;jsessionid=556F95ADF4C56D988B3FED8836465D01.wapp1nC
http://patentscope.wipo.int/search/en/detail.jsf?docId=WO2013186561&recNum=132&docAn=GB2013051548&queryString=nano%20OR%20filter%20OR%20ceramic&maxRec=599628


ところで、MQAエンコードとはちょっと離れますが、さきの記事にちょっと面白い話題が書いてありました。
よく20kHz以上は聞こえないからハイレゾは必要ない、という反駁がありますが、上の"A Hierarchical Approach..."の論文ではなぜハイレゾか、という問いについては20kHz以上の聞こえるかどうかわからない情報の問題と言うよりも、サンプリングレートが高くなることで(ナイキスト周波数が上がって)、よりデジタルフィルターを工夫する余地が増える、という感じのことが書いてあります。
たとえばDAC内でのオーバーサンプリングはハイレゾ関係なく昔からありますが、これは情報量を増やすというよりは、ナイキスト周波数を上げることによるLPFの効きの効率化(設計の簡素化)をするためだったと思います。ですからアップサンプリングも同じですが、補完とか中の情報云々というよりは、ナイキスト周波数をあげる事自体が意味があるという感じでしょうか。
つまりは96kHzをターゲットにフィルタを設計している回路ならば、96kHzで再生するのが効率的、つまり音が良いのではないか、ということです。この辺の視点もハイレゾ論争からは抜け落ちていたように思います。アップサンプリングしたのをオーバーサンプリングするとどうなるか、というと頭痛くなりますが 笑

posted by ささき at 21:44 | TrackBack(0) | __→ PCオーディオ最新技術 | このブログの読者になる | 更新情報をチェックする