音楽をデジタル化する数式をざっくりと解説してみる【サンプリング定理】

今回の内容の動画版はこちら→サンプリング定理【数式鑑賞会】

サンプリング定理
\(  F \)は関数\(  f \)のフーリエ変換で

\(\ \   F(x)=0\ \ x\notin (-A,A) \)…①

を満たすものとする。このとき\(  R \)を十分小さくとれば、

\( \ \ \displaystyle F(\xi)=\frac{R}{\sqrt{2\pi}}\sum_{n=-\infty}^{\infty}f(nR)e^{-inR\xi}  \)…②

が成り立つ。

しっかりとした証明は難しいので、今回は定理がどんな意味を持つのか、概要のみをまとめます。

まず①について。元の関数\(  f \)は今回の話では音のデータに対応します。\(  f \)に高い音がたくさん含まれていればいるほど、\(  f \)が上下に激しく振動している傾向にあります。このとき、そのフーリエ変換\(  F \)は原点から離れたところで大きな値をとる傾向となります。

ここで、人間の1秒間に2万回以上の揺れの音は高すぎて通常人間の耳に聞こえないとされています。いわゆる超音波です。そこで、

「人間の耳に聞こえない音なんだからカットしてもいいよね?」

ということで、周波数の高い音をカット、すなわち\(  F \)に関してある程度原点から離れた部分に関しては強制的に値をゼロにする、ということで①を成り立たせるようにすることができます。これは②を成り立たせるために必要なことです。デジタルは原理的にアナログを”近似する”ことしかできないので、どこかで割り切ってデータを減らしたり荒くしたりする必要があるのです。それを人間に感じにくいところ(今回の場合は高い周波数の音)で行うことで、データが”劣化”していないように感じさせる工夫をしているのです。

次に②について。②の式は、\(  R \)を適切に小さくして離散データ\( \{f(nR)\}_{n\in Z}  \)を集めると元の関数\(  f \)のフーリエ変換\(   F\)が求められることを表しています。\(  F \)が分かればそれに逆フーリエ変換という計算を行うことでもとの関数\(  f \)を求めることができるので、結局

ポツポツの離散データ\( \{f(nR)\}_{n\in Z}  \)から関数\(  f \)が復元できる!

ということになるのです。離散データ\( \{f(nR)\}_{n\in Z}  \)は元データ\(   f\)のサンプリングに相当します。これはかなりエキサイティングな結果です。いうなれば、

・犯人が目撃された数カ所の情報から移動経路を推測する

・一部しか見ることができない状態の絵を見て何が描かれたものか推測する

・優秀な生徒であれば、50分間の授業のうち1分起きて4分寝るを10サイクル繰り返しても授業内容を完全に理解できるか

…みたいな話ですよ。ただしこれら日常的な例はあくまで推測の域を超えないのに対し、②の場合は完全に\(  f \)を求めることができているんです。

今回はサンプリング定理の紹介を証明なしで行いました。何かのキッカケになれば幸いです。では、今回はこの辺で。

(参考)

杉山健一『フーリエ解析講義』

 

★★★

今回の内容の動画版です。