音声(オーディオ信号)のサンプリング周波数はいくらであればいいのか

マイクの出力などのアナログ電気信号をデジタルデータとして取り込む手段にPCMがあります。PCMの基礎は他に譲るとしてその際に充分なサンプリング周波数について理屈を考えます。

 

標本化定理ではアナログ信号の最高周波数の2倍のサンプリング周波数でサンプリングすれば理論的には元の信号が復元できるとされています。しかしこれは現実にはA/D変換器と、再現環境のD/A変換器と補間フィルタが完全に理想的な特性の場合のみにいえることで、実際のA/D変換器、D/A変換器および補間フィルタの性能には限界があり、完全に理想的なものは存在しません。

 

補間フィルタについて説明しておきます。A/D変換器でデジタル化されたアナログ信号はD/A変換器で元のアナログ信号に近い階段状の波形のアナログ信号に戻され、その後不要な高い周波数成分を取り除くフィルタを通って元のアナログ信号となります。このフィルタが補間フィルタです。

 

理想的な特性のフィルタを現実につくることが難しいことは多方面でよく知られていることと思います。A/D変換器、D/A変換器についても理想的な特性のものを簡単につくることは困難です。

 

A/D変換器、D/A変換器および補間フィルタが完全に理想的な特性であれば標本化定理の通りです。人間の可聴領域はおよそ20kHzまでとされています。20kHzまでのアナログ信号をデジタル化して再び完全に元に戻すために必要なサンプリング周波数は40kHzとなります。しかし、理想的な特性のデバイスを実現できないために実際には40kHzでサンプリングしたのでは不十分となります。

 

D/A変換の過程において、理論的には幅が無限に小さい振幅変調されたパルスを生成して原信号を復元するのですが、実際には幅が無限に小さいパルスはつくれないので、有限の幅を持つパルスから原信号を復元します。パルスが幅を持つとどうなるかをフーリエ変換を用いて解析すると、元のアナログ信号は高い周波数ほど(サンプリング周波数の1/2に近づくほど)減衰することがわかります。この現象をアパーチャ効果とよびます。

 

20kHzのアナログ信号を40kHzを超えるサンプリング周波数でサンプリングすることをオーバーサンプリングといいますが、充分高いサンプリング周波数でオーバーサンプリングすることはアパーチャ効果への有効な対策となります。理屈の上ではオーバーサンプリングによる悪影響はなく、むしろ望ましい効果のみが得られます。

 

実際の一般的なA/D変換器は周波数特性がガウシアン特性であることが多いようです。以下、A/D変換器はガウシアン特性として話を進めます。この場合、周波数帯域幅が20kHzであれば20kHzでは3dBの減衰があります。元の信号において3~4%程度の減衰までは無視するとするなら、その場合の帯域幅は20kHzの1/3の周波数となります。

 

以上より、20kHzまでを忠実に復元するのに必要な帯域幅は60kHzとなります。これは帯域幅でサンプリング周波数ではありません。60kHzを忠実に再現できるサンプリング周波数が目的のサンプリング周波数ということになります。標本化定理の通りなら120kHzとなりますが前述の通りこれでは不十分です。

 

A/D変換器、D/A変換器および補間フィルタが理想的な特性でない現実のものであるときには、様々な多くの実際のデバイスアナログ信号を忠実にデジタル化して再び復元するためには、サンプリング周波数は帯域幅の4倍以上あればよいとされることが多いようです。すなわち

 

20kHzまでのアナログ信号を忠実にデジタル化して再び復元するには

3×20kHz×4=240kHz

サンプリング周波数は240kHz以上であればよいことになります。

 

廉価なオーディオインターフェイスのほとんどがサンプリング周波数は192kHz以下までであることを考慮するとかなり高い数値です。実際には96kHzと192kHzでサンプリングした音源を聴き分けるのもなかなか難しいことです。聴覚的にはオーバースペックな感じもしますが信号処理の観点からは以上のような結論となります。

 

20kHzの正弦波を240kHzでサンプリングすると、1周期あたり12回サンプリングすることになります。元の正弦波を正確に復元するのにまずます十分といえそうです。D/A変換器と補間フィルタが少々ひどい特性であってもほぼ元通りの正弦波を復元するのに十分といえるでしょう。

 

96kHzサンプリングだと8kHzまでの信号は正確に再現されることが期待できるわけです。聴覚上重要な情報は8kHz以下に含まれていると判断するなら96kHzサンプリングでも現実の場合に充分となります。参考までに、アナログ電話の音声帯域は0.3~3.4kHzです。

 

なお、アパーチャ効果を改善する方法にはオーバーサンプリングの他にイコライゼーションフィルタを用いる方法があります。

 

高速なA/D変換器は高価ですし、データも大きくなります。そのあたりは忠実性とのトレードオフになります。

 

なお、PCMでは量子化とそれに伴う量子化雑音も重要ですが、今回は標本化のみの話とします。