この記事はデジクリブログリレー企画6日目の記事です。
こんにちは。bayashiです。
ここ最近、DTMをする中で「結局『音の広がり感』や『ステレオイメージ』って何者だったんだ?」と思って気が向いた時に調べたり試したりしてきたのですが、色々と面白かったので今回記事にしてみようと思いました。
特段「DTMする上で絶対に知ってなきゃいけないこと」という訳ではないので気軽に読んでくださいね。
追記 : この記事の内容を創作に直接関わる話題に絞ってまとめ直したライト版を作りました。DTMに直結する話はこっちの方が見やすいかもです。
初めに人の聴覚がどんな風に方向や広がりを捉えているのかについて紹介します。
人間の聴覚が音の左右方向を感じ取るには、主に両耳間での音量差と時間差の2つが重要と言われています。(*1)
両耳間での音量差は割とイメージしやすいかもしれません。例えば音が右から聞こえている時は右耳に入る音量の方が大きくて、左耳に入る音量の方が小さくなります。
両耳間での時間差は、実のところ最大0.5ミリ秒程度のめっっちゃ小さな時間差です。日常生活の中で意識することはほぼないですが、人間の聴覚はこの小さな時間差を割と敏感に捉えています。
例えばこの動画では音を適当に左右に振ったシンセのフレーズが2回流れますが、1回目は音量差だけを変化させていて、2回目は音量差に連動させて時間差も1ミリ秒以下の範囲で変化させています。
若干の違いですが、2回目の方が1回目よりも左右方向をより強く感じるような音になったと思います。(*2)
(画質や環境によっては分かりにくいかも…)
この時間差と音量差ですが、実は音の周波数によって判断に使う優先度が変わるようで、周波数がおよそ1500Hz以下なら時間差を、それより高ければ音量差をもとに方向を判断する傾向があります。
その1500Hzの音ですが、空気中での周期を計算すると約0.7ミリ秒です。両耳の間で起こる時間差が空気中で最大約0.5ミリ秒なので、音波の1周期に満たない程度の時間差です。
つまり両耳間で起こる音の時間差は、音波の位相差として考えることもできます。(*3)
(厳密には「純音(=正弦波)であれば時間差は位相差と等価である」という言い方で説明されることが多いです。
というのも正弦波ではない場合、一つの音にいろんな周波数成分が含まれるので本当はちょっと面倒ですが、ここでは深く考えないことにします。)
位相というのは「波が1周期の始まりからどれだけ経ったか」を表す値です。正弦波の三角関数なら sin θ の「θ」が位相です。
英語ではphase(フェーズ)と言いますが、これは「段階」や「局面」という意味の単語でもあるので、振動の状態を示すものと捉えても良いでしょう。
両耳の間の時間差を音波の位相差として捉えられるということは、極端に言えば左右の耳に入る音の振動状態がどれだけ違うのかを方向の判断材料にしていると考えることも出来ます。
例えばこの動画でもさっきと同じフレーズが流れますが、1回目は左右で全く振動状態が同じもので、2回目は左右で振動の山と谷が逆転している(つまり逆位相 : 振動の状態が最も異なっている)ものです。
1回目は前方中央から聞こえるように、2回目は漠然と「中央以外から聞こえてくる」ような感じがすると思います。
もしスピーカーを左右に配置して再生出来るのであれば、是非一度ある程度の音量で鳴らしてみてください。おそらく「目の前に音の空白がある」という不思議な感覚になると思います。
そんな訳で、音の広がり感は「左右で振動の状態がどれだけ違うか」によって変わるとざっくり考えることが出来るでしょう。
(ここまで来ると「位相」と呼んでいいのか怪しくなってくるので、左右の振幅の違いを「両耳間相関係数」という-1から+1までの値で表すことも多いです。振幅の山と谷が左右で一致するほど+1に、真逆になるほど-1に近づきます。)
これまでの話をまとめると、音の広さというのは「音が左右でどれだけ違う振動をしているのか」によって変わってくる、ということでした。
この「音の広さ」を捉える方法の一つにリサージュメーターを使うものがあります。(呼び方はリサジュー、フェイズスコープ、ゴニオメーターなど色々あります。)
リサージュメーターというのはこんな感じのメーターです。これは Ozone Imager というプラグインで表示できるものです。
このように音に反応してなんか光ります。
これは何を示しているのかというと、左下から右上に伸びる線がステレオ右音声の振幅を、右下から左上に伸びる線がステレオ左音声の振幅を表していて、この平面上に一瞬ごとの振幅の値が青い点としてぽつぽつとプロットされていきます。(*4)
例えば、ある瞬間の振幅が (L = 1.0, R = 1.0) なら一番上の頂点にプロットされて、(L = 1.0, R = -1.0) なら左の頂点にプロットされる…という具合です。
さっきの動画では全体として縦長の楕円形に点が分布していますが、おおまかには縦方向の中心から離れるほど左右で振動の状態が異なることを意味するので、分布の横方向への広さが「音の広がり感」を表していると考えることが出来ます。
とはいえ、これは「空間の広さや立体感の強さ」というよりも「漠然とした音が広がっている感の強さ」を示すものです。(*5)「音がどれだけモノラルではないか」を表していると考えてもいいかもしれません。
リサージュメーターでは、ステレオ音声の中で Midと呼ばれる左右共通な成分 と Sideと呼ばれる左右で異なる成分 のバランスを確認することも出来ます。
MidとSideの定義をもう少し厳密に書くと、
Mid : 左右で 位相が同じ
波の山と谷が一致する
相関が+1の 音の成分
Side : 左右で 位相が真逆の
波の山と谷が反転している
相関が-1の 音の成分
です。
つまりリサージュメーター上で考えると、Mid/Sideはそれぞれ下の図のような座標軸で振幅を捉え直した見方だと考えることができます。
…ということは、
音の広がり感が強い = Side成分が(相対的に)多い
と考えることが出来ます。
ちょっとややこしくなったのでまとめると、
というのがここまでの話です。
なお、リサージュメーターの用途は他にもいろいろあるみたいですが、話が逸れてしまうので知りたい方はこちらなどを当たってみてください。
ここからは具体的にDTMで音の広がり感を作るための方法を一通り紹介します。
一番簡単なのは「ステレオイメージャー」と呼ばれるプラグインを使うことです。
フリーのものだと iZotopeのOzone Imager や、 Polyverse MusicのWider がよく使われます。
それぞれ音の傾向は違いますが、どちらもスライダーひとつで音を広げられる便利なプラグインです。
残響効果を加えるリバーブや、やまびこ効果を加えるディレイなどのいわゆる「空間系エフェクト」は、文字通り音が鳴る空間を表現するためのエフェクトです。もちろん使い方次第でいろんな空間が表現できますが、広い空間を表現しようとすれば広がり感も強くなります。
フリーだと、ディレイにもリバーブにもなる少し特殊なタイプですが Valhalla Supermassive がめっちゃ優秀です。(はじめての方はとりあえずプリセットを触ってみるといいでしょう。)
私は普段あまり使わないですが、コーラス・フランジャー・フェーザーなどといった「音をうねらせる」ためのモジュレーション系エフェクトを使っても音の広がり感を強められます。よくエレキギターのエフェクターとしても使われているものたちですね。
種類によって広がり感が強いタイプと中央にまとまるタイプの差が大きいので、音を広げたいときはリサージュメーターを見て確認しながら選ぶといいでしょう。
ちょっと荒技感はありますが元々ステレオの音に対してなら直接MidとSideのバランスを変えてしまえばええやん!ということで、イコライザなどを使って直接弄るのもアリです。そうすると「特定の音域だけ広くしたい/狭くしたい」という時にも柔軟に対応できます。
Mid/Side処理が出来るフリーのイコライザだと MeldaProductionのMEqualizer が良いかなと思います。はちゃめちゃに多機能なのでイコライザの操作に少し慣れてから触れてみるといいかもしれません。
ここまで音を広げるための方法について書いてきました。音に広がりがあると気持ちいいのでどんどん広げていきたいところですが、少し気をつけないといけないことがあります。
特にステレオイメージャーを使ったりMid/Side処理をしたとき、つまり音の広がり感を直接弄ったときに気をつけたいことです。
この記事の前半で「Side成分の比率が大きいほど広がり感が強い」と書きましたが、ここでSideとはどんなものだったのかを思い出してみると「左右で位相が真逆の音の成分」でした。
では、Side成分の多い楽曲を左右2つのスピーカーで空気中に出力するとどうなるでしょう。
音は空気中を伝わる縦波です。
波源が2つある場合、伝わる波どうしは干渉を起こします。
干渉が起こると、波が強め合う地点と弱め合う地点が出来ます。
位相が真逆の波(Side)はどんな干渉が起こるでしょうか。
強め合う条件・弱め合う条件が、位相の同じ波(Mid)と真逆になります。
つまり音を広げすぎてSide成分が多くなると、スピーカーで再生したときに距離や角度によって音のバランスが変化してしまいます。
それを例えば映画作品や野外でのイベントなどで意図的に引き起こすのならとても面白いですが、そうでなければ環境によって聞こえ方が大きく変わってしまうのは避けたいところです。
イヤホンやヘッドホンを使ってミキシングしている段階でも、Side成分が大きくなり過ぎると空間的なイメージや音の方向感覚が徐々に崩れ、いつの間にか混沌とした世界が広がっていきます。
ここまで来てしまうと文字通り右も左も分からず、ミキシング作業が暗礁に乗り上げます。
一度そうなってしまったら、とりあえずステレオイメージャーやMid/Side処理をしているイコライザを一旦オフにして、音量バランスの調整からやり直すしかなくなります。音全体の印象もかなり変わるので復旧は相当骨の折れる作業になってしまいます。(体験談)
1. とりあえずリサージュメーターを見る
マスタートラックにOzone Imagerなどリサージュメーターの付いているプラグインを挿して様子を見ましょう。ある程度の目安になります。
もしちょっと怪しい形で推移していたとしても、最終的には次に説明するようにモノラル化したりスピーカーシミュレーターを通して違和感がなければOKです。
2. 定期的にモノラルやスピーカーシミュレーターで音を聴く
広がり過ぎている場合、モノラルで再生すると聴こえ方が大きく変わります。
一般的にステレオをモノラルに変換するときはステレオの右と左の音声を足して2で割るので、このときSide成分は逆位相で打ち消しあって消えます。
もちろん、元々ステレオだったものを無理やりモノラルにするので多少聴こえ方が変わるのは当然ですが、それでも明らかに雰囲気が変わってしまったり特定のトラックが聞こえなくなってしまう場合はイメージャーの設定などを見直してみましょう。(*6)
また、モノラルで確認するのではなく、スピーカーっぽい特性や広がり感を再現する「スピーカーシミュレーター」のプラグインを利用するのもおすすめです。
最近私はDOTEC-AUDIOのDeeSpeaker というスピーカーシミュレーターを使っています。
モノラルに近い状態での聴こえ方を確認するついでに、低音域や高音域が伸び切らない環境でもしっかり鳴るか簡易的にチェック出来るので便利です。
では、Sideが大きくなり過ぎることを抑えながら広がり感を作っていくにはどうすればいいかな、と思って最近私が試していることを最後に紹介します。
Mid成分が強いと音に安定感が得られて、Side成分が比較的強いと浮遊感が得られる傾向があります。(と私は思っています。)
なので、私はとりあえずメロディなど目立たせたい音はSide成分を小さめに、伴奏などはMid成分を小さめにする試みをしています。
あまりがっつり音量を変えたりイコライザをかけたりすると不自然になってしまうので、少し慎重に調整していきます。
私は最近この処理をリバーブエフェクトの後からかけるのがマイブームです。
上手くいけば全体的な音の分離感が良くなって、見通しのいい広がり感を作れます。
たまに特定のトラックのSide成分だけが妙に大きい状態に遭遇することがあります。具体的には「他のトラックと比べて広がり感が飛び抜けている」という状態です。
元々音源自体がそういう性質だったり、リバーブをかけた結果そうなってしまったり、原因はいろいろです。
そうなるとどんなに音量調整をしたりイコライザをかけても上手く馴染まなかったり、目立って欲しいのになんとなく控えめに落ち着いてしまったりすることがあります。
とはいえ音源やエフェクトを大幅に変えて音のイメージを変えたくはない…という時は、Sideだけイコライザをかけたり音量を落としたりすると綺麗にまとまることがあります。
私はお気に入りの弦楽器音源がSide成分の中低音だけ大きくなりやすいので、イコライザで軽くカットしながら使っています。(それさえ上手く乗り切れれば深みのある良い音がするんです…!)
そんな時Side成分だけを聴けたら便利ですが、私は TBProAudioのISOL8 (たぶん読みは"isolate") というプラグインの力を借りています。ISOL8は他にもMid成分(モノラル)だけ抜き出したり、特定の音域だけ音を消したり、いろんな条件を指定して音の聴こえ方をチェックすることが出来たりします。
ということで、音の広がり感を中心にいろいろ話を広げてしまいましたがいかがだったでしょうか。
冒頭でもちょっと触れましたが、今回の内容は私個人の興味全開なので「DTMをするなら知らなきゃいけないこと」という訳ではありません。
DTMと一口に言っても興味を持つ部分は人それぞれです。私は「音の雰囲気や聴こえ方を自在に作り込めるのが面白いなー」と思っていたのでこんな感じになっております。
もしもミキシングや音の広がり感に興味を持っている方に楽しんでもらえたなら、もしくは記事を通して興味を持ってもらえたなら嬉しく思います。
追記 : DTMに直結する話だけ確認したい方は ライト版 もどうぞ。
音源定位 - 脳科学辞典
心理学ワールド 89号 顔 音の方向知覚とその加齢変化 | 日本心理学会
(*1) 厳密には音量差と時間差以外に、耳や頭の形による音の反射や回り込みの影響も重要です。(これを表したものを頭部伝達関数 : HRTFといいます。)しかも耳や頭の形は一人一人少しずつ違うので「誰にとっても究極にリアルな立体感を感じる音」を作るのは結構大変です。最近では人の横顔の写真から耳や頭の形を判断して、その人の聴こえ方の特性を推定するシステムもあるとか。
(*2) 実は音量差を変化させずに時間差だけを変化させた時にも、音が早く到達した方向から聞こえてきたように錯覚する効果が知られています。(ハース効果と呼ばれます。)
(*3) 本当は周期的ではない音に対して位相は定義されませんが、DTMでは多くの場合「1曲or1トラック全体を1周期の音だと解釈する」か「一瞬の音をきっと周期的なのだと解釈する」ことで大体は乗り切れます。(もっと良い解釈があれば誰か教えてください。)
(*4) ここの図でRをx軸、Lをy軸として見たとき、この分布に対して相関を取ったものが両耳間相関係数だと言えます。
(*5) 例えばASMRなどの収録に用いられる、立体感の強い「バイノーラル録音」による音声をリサージュメーターで見ても、振幅の全体的な分布は概ね縦長〜円形になります。
(*6) 昔から「ステレオ音源でもモノラルでちゃんと聴けるようにするといい」という風説があったりしますが、結局これは「ちゃんと聞こえてほしい重要な音がMidに十分含まれていると良い」という意味なのかもしれません。