波動現象としてのDTM

この記事は東京大学応用物理学系 Advent Calendar 2020 14日目のものです。13日目の記事はこちら

 

 

はじめに

 こんにちは。物理工学科4年のばいそん(@B1s00n)と申します。普段は日々物理を探究すべく研鑽に励んでいますが、今日は趣味で続けているDTMの話をしようと思います。

 

DTMとはDesk Top Musicの略称です。PC上で専用のソフトを用いて行う作曲行為のことを指します。私は所属しているサークルの関係もあり、暇を見つけて曲を作るようにしています。普段はこんな曲を作っています(宣伝)。↓

 

soundcloud.com

 

さて、音は空気を媒質とする波です。つまり、DTMは波を扱う物理ですね(諸説あり)。「波動現象としてのDTM」などと銘打ちましたが、本記事は(音楽理論などではなく)主に「波」という視点から作曲に関するいくつかのトピックについて眺めていこうというものです。

 

この記事を見ている方はおそらく作曲をやっていない方が多いと思いますが、作曲側の視点から音楽を眺めることで音楽の楽しみ方をより豊かなものにできれば、とも思っています。

 

※筆者は音声処理を専門でやっているわけではないためそちらに詳しい方からすると甘い部分があるかもしれませんが予めご了承ください。

 

MS処理

人間は音の方位を感じることができます。というのも、人間には耳が2つ生えているからです。以下では簡単のため、左耳、右耳が認識する信号をそれぞれL、Rとします。

 

音源が人間に対し真正面にある場合L、Rは全く同じものになります。しかし音源が正面から左右にずれた場合、まず音源と耳との距離の変化によってLとRに時間差が現れ、さらに音の耳への当り方の違いによって波形が変化します。人間が音の方位を感じることができるということは、「L-R」を認識しているということに他なりません。

 

この考えのもと、L、Rという2つの信号をM、Sという2つの信号に変換して別々に処理を行う、ということを考えます。ここでMとSは次の式で与えられます。

f:id:B1s00n:20201212182416p:plain

MはMid成分、SはSide成分と呼びます。MS信号に対し別々に処理を行い、再びLR信号に戻す、という処理を行うことで音の広がりを操作することができます。これをMS処理と呼びます。

 

こと音楽に関しては、理論を追うよりも実際に体験するのが手っ取り早いです。MS処理の効果がよく現れている部分を実際に聴いてみましょう(ぜひイヤホンなどをつけてみましょう)。

 

Mid 

Side 

Mid+Side 

 

いかがでしょうか?最も特徴的なのはSide成分だと思います。5秒あたりまでは残響のような音しか聴こえませんが、5秒あたりから急に音が大きくなっているのが分かるかと思います。Side成分を切った状態からいきなり豪華にすることで曲を盛り上げることができます。

 

また、リズム隊やベースの音がMid成分でしか聴こえないのも分かるかと思います。これは曲の柱となるリズムや低音が左右によっていると安定感が無くなってしまうためです。

 

これはあくまで一例に過ぎません。普段聴き慣れている曲でもMid成分とSide成分に分けてみると、きっと面白い発見があるでしょう。

 

音の重ね方

多くの方が曲として思い浮かべるのは、複数の楽器が同時に鳴っているような曲だと思います*1

 

曲を作るにあたって、適当に音を重ねるだけではよい曲にはなりません。これについては、曲を弁当に例えるとわかりやすいのではないかと思います。

 

まず時間(周波数)領域の容器を用意します。容器には容量があり、中身を入れすぎるとはみ出します。

 

f:id:B1s00n:20201206153131p:plain

時間(周波数)領域の容器

作曲とは、弁当の盛り付けです。決められた容量の中に何を、どこに、どのくらい入れるかを決めていきます。容器からはみ出さないように、それでいて隙間なく中身が詰まった弁当は一般的によいとされていますが、曲も同じです。

f:id:B1s00n:20201206162926p:plain

よい曲

f:id:B1s00n:20201206162920p:plain

よくない曲

弁当と曲は次のように対応します。

 

f:id:B1s00n:20201206162236p:plain

わかりやすい表

「よくない曲」について、一見おいしそうに見えるかも知れませんが、それぞれのおかずの主張が激しく弁当として非常にまとまりが悪いです。また、細かいおかずの一品一品を見えなくして潰してしまっています。

 

イメージ的にはこれと全く同じことが曲でも起こります。時間領域と周波数領域について、対策を具体的にみていきましょう。

 

時間領域

ここではダッキングと呼ばれる手法を紹介します*2。早速ですが、ダッキングがかかった音を聴いてみましょう。

 

 

「んわんわ」というような独特な音ですね。 拍の頭での音量を小さくすることでこのような音になっています。

 

ダッキングの狙いは、アタックを目立たせることです。アタックとは、音の出だしの勢いのことを指します。キック*3は、アタックが重要な楽器の一つです。アタックが重要な楽器とアタックが重要ではない楽器が重なっていると、せっかくのアタック感を潰してしまいます。そこで上で聴いたようなダッキングが効いてくるというわけです。

 

また、時間領域では「ある程度の隙間」も重要になってきます。音のダイナミクスによって曲にノリが生まれます。ダッキングは音の小さい部分を作ることによってこの独特のノリも生み出すことができるのです。すごいですね。

 

最後に先ほどの部分を全ての楽器が入っている状態で聴いてみましょう。

 

 

周波数領域 

よい信号*4は、様々な周波数を持つ sin波の重ね合わせで書くことができました。音の波形に対してフーリエ変換を施すことで、音がどんな周波数成分を持っているかがわかります。

 

なんとなくお気づきかも知れませんが、この節では周波数領域で重ならないように音を調整しよう、という話をします。

 

この辺りの話はかなり奥が深く、詳しく説明するとそれだけで何本も記事が生まれてしまうので本記事では低音(〜200Hz)とそれ以外の重なりのみに絞って話をしようと思います。

 

 本記事の定義では、キックの低音部分およびベースが低音に該当します。特に気をつけなければならないのはベースの高音部分がコード楽器等の低音部分と重なってしまうことです。こうなるとマスキングと呼ばれる現象が起こり、非常にモコっとした曲になってしまいます。

 

よくある間違いが、マスキングによって聴こえなくなってしまっている音を目立たせせようと思って音量を大きくしてしまうことです。こうなると周波数的に重なっている部分はより重なってしまい、もっとひどい状態になってしまいます。

 

重なっている部分を解消すればそれぞれの音ははっきりと聴こえるようになります。音を重ねるときは「足し算」ではなく「引き算」で考えましょう。

 

ここで拙作の低音部分のスペクトルを見てみましょう。

f:id:B1s00n:20201206193152p:plain

キック+ベース

200Hz以下程度にまとまっていますね*5。またキック+ベースを除いた部分も見てみましょう。

f:id:B1s00n:20201206193501p:plain

(キック+ベース)以外の部分(スネアを除く)

f:id:B1s00n:20201206193610p:plain

スネア

今度は200Hz以上の部分に程よくまとまっていると思います。わざわざスネアだけ別にしていますが、これはスネアの胴鳴りの部分が大体200Hzあたりに存在するのを見たかったためです。この曲の構成としては、スネアの胴鳴りを境にして低音部分とそれ以外が分かれている、というものにしています。

 

以上の話についてですが、一つの正解が存在するような事柄ではなく、作り手によって様々な構成をしています。また今回は200Hz周辺の重なりの話のみをしましたが、どこの周波数に何が存在しているかによって他にも様々な話が出てきます。気になる人はミックスマスタリングで調べてみるとよいと思います。

 

まとめ

いかがでしたか?音楽は感覚的なものの一つではありますが、理論立てて理解できる部分もあるということが分かるかと思います。

 

普段曲を聴くときに、たまには「作り手がどんな工夫をしているか」に意識を向けてみると、面白いのではないでしょうか。

*1:ピアノ独奏曲などもありますが、ここでは考えないことにします。

*2:サイドチェインという名前でも知られていますが、正確にはサイドチェインを用いてダッキングする、という言い方が正しいです。

*3:バスドラムのこと。

*4:少なくともDTMではよい信号しか扱いません。

*5:キックのアタック成分には200Hz以上の部分も含まれていますが分かりやすさのためにアタックから少し後のスペクトルをみています。