どこからがニセレゾか

音が良ければそれで良いじゃん!serです。

 ハイレゾという言葉が普及するに伴い、「ニセレゾ」という言葉が出てきました。ハイレゾでないのに、フォーマットだけをハイレゾにした音源のことです。
 
 そもそもハイレゾ音源とは何なのか。ハイレゾという言葉を一気に普及させたSonyの解説を引用してみます。
 
 "ハイレゾオーディオとは、CD(16bit/44.1kHz)を超える高音質オーディオのこと。"
 "格段にきめ細やかなサウンドで、よりオリジナル(原音)に近い環境へあなたを導き、かつてない臨場感をお届けします。"
 (http://www.sony.jp/system-stereo/lineup/high-reso.html より)

 つまり、ハイレゾとはCDを超えるものということのようです。確かにこの定義からすれば、ハイレゾ音源というのはCD音源をフォーマットだけハイレゾにしただけでは、ニセレゾと呼ばれても仕方ないです。
 しかし、CDでもハッとするほど音が良いものは腐るほどあります(ハッとするほど音の悪いものも腐るほどありますが)。では、CDを超えるとは一体何なのでしょうか。
 
 アナログデータをサンプリングと量子化によってデジタルデータにするという話は、ここではやめておきます。要は、CD(16bit/44.1kHz)は1秒間に44100回サンプリングして、値の大きさを2^16(65536)段階で定義するということです。
 つまり、ハイレゾとは1秒間に44100回以上サンプリングするか、値を2^16(65536)段階以上の精度で量子化するかのどちらか、もしくは両方満たす音源ということになります。
 更に、”高音質”,"格段にきめ細やかな"と言っていますから、ただ、サンプリングレートやビット深度を変えるだけではなく、それらが違うことによってCDよりも音が良いものがハイレゾ音源となります。
 ただ、CDよりも音が良いということを定義するのは難しいので、CDよりもサンプリングレートやビット深度が大きいことでのメリットを定義してみましょう。そのメリットが音源になかったら「ニセレゾ」ということになります。
 ※DSDはよくわかんないので、PCMに限定します。

サンプリングレートが高いことのメリット
 ・22.05kHz以上の音を録音、再生できる
  一番取り上げられてるのはこれでしょう。一般に可聴域外といわれていますが、音として 録再出来る以上、メリットに違いはありません。

 ・時間軸精度が上がる
  そりゃサンプリングレートがあがれば、1秒間に何回サンプリングできるかということが 変わりますから、あがればあがるほど、いつ発音するかという精度が上がります。最近のほ とんどのDACはオーバーサンプリング処理をして、補完することによって低いサンプリング レートでも時間軸精度を担保していますが、補完するよりも元から決められていた方が良い でしょう。

ビット深度が大きいことのメリット
 ・より小さい音を録音/再生できる
  16bitだと65536段階、24bitだと16777216段階ですから、20*logXに当てはめると、  16bitが約-96dbの音までなのが、24bitだと約-144dbの音まで録再出来ることになります。

 ・より音量変化が滑らかになる
  音量は0dbから(-20*log2^X)dbまで、均等に量子化されるわけではありません。0dbに 近くなればなるほど細かくなります。
  例えば、ある値XからX+1までの音量差が、0.01dbになる点を探してみましょう。
  計算式は20*(logX-log(X-1))=0.01です。Xは約869となるので、16bitだと約-37db、  24bitだと約-85dbになります。つまり、それ以下の音量になると、どんどん音量差は粗くな ります。それに伴いノイズが発生します。量子化ノイズってやつですね。ビット深度を大き くすればするほど、量子化ノイズを減らすことが出来ます。

 ここでは分けて述べましたが、サンプリングレートとビット深度のメリットは相互に関わってきます。時間軸精度が上がっても、音量変化が滑らかでなければ意味が無いですし、その逆もしかりです。
 では、どういう音源がこれらのメリットを満たしているのか考えてみましょう。

 ・録音/編集が16bit/44.1kHzより大きい値で行われている

 以上です。わあ。ここまで長ったらしく書いているのに、これだけで終わりです。でも、ハイレゾ音源の問題点UAD2のローパスフィルターで書いている通り、編集段階や録音段階でハイレゾであってもメリットが失われることがあります。

 そもそも、今のDAW及びプラグインではアップサンプリング処理やSRCは当たり前のように行われています。つまり、録音時のサンプリングレートは、知らず知らずのうちに変えられてしまっているということです。整数倍にあげて整数倍に落とすならともかく、大体の処理系は単純化するためにある一定のサンプリングレートで処理をするため、非整数倍の処理が行われます。つまり、時間軸精度はDAWプラグインを使うことによって失われるのです。
 時間軸精度が失われれば、音量変化が滑らかになったところで意味がありません。

 さて、それでは現代の音楽制作環境を鑑みた上でハイレゾ音源の定義をしてみましょう。
 ・デジタル化するのはマスター作成の時のみ
 そんな音源は世に存在するとしても100に満たないでしょう。安心してください。世にある音源の99.999%以上はニセレゾです。ニセレゾばんざい!音が良ければそれでいいのさ!


おまけ

 CDに落とす時に44.1kHzにするんだから、なんで88.2kHzで作業しないんだろう、96kHzが一般的なのはなんでなんだろう、と思ってましたが、そりゃそうですわ。96⇔88.2が沢山行われるよりも、96→44.1kHzが最終段で1回行われてる方が良いに決まってます。
 
 DACのオーバーサンプリング処理ですが、そもそもハイレゾ音源に必要なのかっていう疑問が出てきました。44.1kHzの場合は20kHzを通して、22.05kHzは通さないって言うむちゃくちゃなフィルタが求められたために誕生したオーバーサンプリング処理ですが、ハイレゾ音源なら、フィルタの難易度は下がります。例えば88.2kHzならば20kHzを担保するのに、20kHzから44.1kHzのフィルタで済みますし、それより上なら更に楽になります。
 問題点は、メリットの一つであるより高い周波数の音が再生できなくなるという点にありますが、まぁ良いんじゃないでしょうか、どーせなくたって分かりませんって。
 つまり、NOS ADCとNOS DACハイレゾの時代になって、真価を生かせるのではないかなと。むむむ。
 明後日はDSD256での本番録音が待っているのですが、DSDは今のDACの構造にあっているので良いとして、NOS DACのためのNOS ADC録音が欲しいですなぁ!秋の課題です。