音の源のおはなし

written by masa-u (5JS) <masa-u@mbin.jp>

コンピュータゲームにおいて重要な要素のうちのひとつは「音」です。 効果音もBGMも鳴らないゲーム、というのにお目にかかることは 滅多にありません。

音を鳴らすには、そのゲーム機やコンピュータに音源装置が 搭載されている必要がありますが、ひとくちに「音源」といっても さまざまな種類があります (もっとも、最近のゲーム機はPCM音源ばかりのようですが)。

ゲームで使われる音源について、ひととおり紹介してみましょう。


1.   PSG


PSGとは「Programmable Sound Generator」の略で、 直訳すれば、「プログラムコントロール可能な音源」という意味です。 つまりコンピュータから鳴らすことのできる音源は全てPSGなのですが、 これは広義の定義であって、実際に「PSG」というと、 電化製品のボタン操作確認音 1 のような、「ピー」とか「プー」とかいう単純な音、 いわゆる「電子音」を出すものを指します。

PSGの原理については割愛しますが、 1980年代前半ごろのゲームの音はほとんどがコレでした。 特に、任天堂のファミコンに搭載されていましたので、 「ファミコンの音」として有名です。 PSG以前のアナログ音源 2 に比べ、回路が圧倒的に単純で済むため、普及したのでしょう。

   PSGの音は、左図に示すような波形をしています。

四角い形をしているので、「矩形波」(くけいは)と呼ばれています。 ご覧の通り、良くも悪くも「シンプル」な波形です。 あまりにシンプルなため、これだけでは貧相な音しか再現できないので、 PSGでは、音程の異なる音を重ねて、波形に変化を持たせる、 というテクニックがよく用いられます。 そのため、PSGでは、1つの音に複数のチャンネル 3 を使用する、ということが珍しくありません。

   こんどの図は、 3チャンネルを用いた場合の波形の例です。

他にも、波形のデューティー比を変化させる、鳴らすタイミングをわざとずらす、 エンベロープをかける、などなど、たくさんのテクニックがあり、 これらを組み合わせることにより、さまざまな音を出すことができます。 PSGは、音をプログラムする側の技量も必要とするのですが、逆に言うなれば、 このへんが「腕の見せどころ」ともなります。

とかく「ファミコンの音」というと、「ちゃち」な音であると言われがちです。 が、それはファミコンがたった3チャンネルのPSGしか積んでいない 4 ため、和音を鳴らそうとすると、どうしても1つの音に1チャンネルしか 割り当てられなかったり、当時はサウンドプログラマの腕そのものがまだ低かったり、 といったことが原因で、決してPSGそのもののポテンシャルが低いわけではないのです。 たとえば当時のアーケードゲーム機などには、 たくさんのPSGチャンネルを搭載し、驚くほど重厚な音楽を奏でるものもあります 5

非常に「扱いにくい」音源ではありますが、その分、魅力も大きい音源です。

PSG音源の音の例1 (「アルカノイド」 株式会社タイトー 1986年 ゲーム開始時)
PSG音源の音の例2 (「スターフォース」 株式会社テーカン(現:テクモ株式会社) 1984年 ゲーム開始時)


2.   FM音源


「FM」とは、Frequency Modulationの略で、周波数変調のことを指します。 ただ、原理的にはそれほど難しく考える必要はなく、 PSGの発展形だと思えば良いでしょう。

FM音源とは、PSGの矩形波のかわりに正弦波、つまりサインウエーブを使い、 さらに先述の「チャンネルの重ねあわせ」を 数式を用いてチップ内で行えるものをいいます。 有名なところでは、ファミコンのディスクシステム、NECのPC-9801シリーズの一部、 初期のSoundBlasterカード、最近の携帯電話 6 なんかにこの音源が搭載されています 。

PSGではカクカクの矩形波だったものが、なめらかな正弦波も使用できるようになり、 波形の重ねあわせ作業も数式により簡略化されたため、 より手軽に多彩な音の表現が可能になっています。 数式を用いた波形の合成は、時間が経つにつれ合成の割合が変わっていく、 というようなことも自動でできるため、 けっこう楽にいろいろな音が出せてしまうのです。

1980年代当時、ディスクシステムやPC-9801シリーズの音のすばらしさに感動した 経験のある人は少なくないでしょう。 また、今日になってもこの音源が携帯電話で現役であることを考えると、 意外と優れた音源であることがわかります。

しかしながら、FM音源も基本はPSGと変わりなく、必要な音が出るかどうかは サウンドプログラマの腕にかかっており、扱いにくい音源であることには 変わりありません。
このあたりが弱点でしょうか。

FM音源の音の例 (「アルカノイド リベンジ・オブ・ドゥー」 株式会社タイトー 1987年 ステージ開始時)


3.   ウエーブテーブル音源


注意
ここでとりあげるウエーブテーブル音源は古いタイプのものです。 最近のサウンドカードなどに搭載されているウエーブテーブル音源については、 次の「PCM音源」の項を参照してください。

ウエーブテーブル音源は、今までの音源とは違ったタイプの音源です。

PSGには矩形波、FM音源には正弦波、というように、PSGやFM音源には 「基本の波形」がありました。しかし、ウエーブテーブル音源には これがありません。音源だけの状態では音が出せないのです。 ではどうするのかというと、まず、 プログラムが音源に波形データを1波長ぶんだけ与えます。 そうしてから、その波形データを使って音を出せ、という命令を与えます。 すると、音源は、与えられた波形を繰り返し出力し、音とするのです。

   たとえば、左図のような波形データを音源に与え、 音を出させてみます。

   音源は波形データを繰り返し出力するので、 波形データの両端がつながって、結果として、 左図のような波形が出力されることになります。

波形はデジタルデータとして処理され、PSGのような矩形波やFM音源のような 正弦波はもちろん、どんな波形でも、データさえあれば出力ができます。 そのため、さらに多彩な音を出すことが可能になっています。

   左図は、そのほかの例です。

この音源は次項で解説するPCM音源にすぐとってかわられてしまったので、 明示的にウエーブテーブル音源と呼べるものは、 アーケードゲーム機やAppleのMacintoshに搭載された程度にとどまっているようです。

音質としては、当時はまだD/Aコンバータ 7 のサンプリングレート 8 が低かったため、少々ざらざらした感じの音になりますが、 PSGやFM音源には出せない独特な音が特徴です。 昔のナムコやコナミのゲーム 9 はこの音源をフル活用していて、そのBGMは高い評価を得ていました。

弱点は、扱うことのできる波形データの長さがあまり長くない 10 ということです。 このため、たとえばピアノの音を録音してそのまま使う、 というようなことはできず、やはりまだ、必要な音を得るためには、 プログラムする側の技術力が大きく関わってきてしまいます。 短い波形の編集のみで自在に音をつくるのは、けっこう難しい作業なのです。

ウエーブテーブル音源の音の例 (「ドルアーガの塔」 株式会社ナムコ 1984年 ステージ開始時)


4.   PCM音源


PCM音源は現在もっともありふれた音源ではないでしょうか。 パソコン、オーディオ、電子楽器、 その他さまざまなところで利用されている音源です。 ちなみに、PCMとは「Pulse Code Modulation」の略で、 パルス符号化変調のことなのですが、こんな用語を使うより、 「デジタル音源」とか「サンプリング音源」と言った方が わかりやすいかもしれませんね。 最近のサウンドカードなどにおける「ウエーブテーブル音源」というのも、 実はこのPCM音源のことです 11

原理的にはウエーブテーブル音源の親戚で、ウエーブテーブル音源が 短い波形しか扱えなかったのに対し、PCM音源では、 記憶装置が許す限り、いくらでも長い波形を使えます。 また、波形データを途切れることなく音源に送ることにより、 ラジオのように変化しつつも終わりの無いような音声の再生もできます 12

データにさえしてしまえば、どんな音でも再現ができるのです 13

音をプログラムする側からしても、鳴らしたい音があったら、 それを録音してデジタルデータにし、PCM音源に供給するだけでいいので、 非常に簡単に目的の音を得られます 14。 いままで挙げた音源は、音そのものを得るまでにかなりの労力が必要ですが、 それに比べると、PCM音源の場合、音を得るだけならずいぶんカンタンだといえます。

ここまで書くといいことづくめのように思われるかもしれません。 しかし、弱点がないわけではないのです。 PCM音源の弱点はその波形データ量の大きさです。 たとえば、ごく一般的なCDについて考えてみましょう。 CDはサンプリングレート44.1kHz、16ビット/サンプル、2チャンネルです。 ここから1秒間のデータ量を計算すると、

データ量 = 44100sample / 1sec × 16bits / 1sample × 2 × 1sec

 = 44100 × 16bits × 2

 = 1411200bits = 176400bytes = 172.27KB

これは1分間にすると10MBにもなってしまいます。 昨今は大容量メディアが一般的ですのでこれくらいの容量はなんでもありませんが、 インターネット配信される場合などは、 やはりちょっとネックになってしまう容量です。


5.   MIDI音源


MIDI 15 というのは、音を出す原理の名前ではなく、制御プロトコルの名前なので、 本来はここに並べて挙げるのは正しくないのですが、 最近は「MIDI音源」という「音源の種類」を確立してしまっているので、 敢えてここに挙げることにします。

MIDI音源とは、内部に何らかの音源を持ち、MIDI規格の通信プロトコルに従って その音源をコントロールし、音を出す装置のことを言います。 中に入っている音源は、最近はPCM音源が多いようですが、 FM音源やウエーブテーブル音源を搭載したMIDI音源も存在します。 昔は大きな装置で、PCの外付けにして使うものでしたが、 最近はずいぶんと小型化が進み、サウンドカードにワンチップで 搭載されるのが一般的になってきています。 そのため、現在ではほとんどのPCにMIDI音源が搭載されています 16

MIDI音源の大きな特徴として、統一の「音色番号」のようなものが存在し、 その番号を指定してやるとその音が出る、ということが挙げられます。 たとえば、General MIDIという規格では、音色番号1番はピアノの音なので、 1番を指定して音を出すと、ピアノの音が出ます。

MIDIの最大の特長にして最大の欠点は、このことに由来します。 特長のほうは、音色が予め決まっているので、 いままで挙げた音源では必要だった「音を作る」 という作業が要りません。音を出すのがこの上なくカンタンです。 しかし欠点は、音色番号に含まれていない音は出せないこと、 そして、同じ音色番号でも音源によって音が違うということです。

先ほど、音色番号1番はピアノである、と書きましたが、これは極端なことを言うと、 内部で実際に音を出している音源がPSGであろうが FM音源であろうがウエーブテーブル音源であろうが PCM音源であろうが、「とにかく1番はピアノ、誰が何と言おうとピアノ」なのです。 そう、音色番号とそれに対応する楽器の名前は定義されているのですが、 これは、具体的にどういう音か、ということを定義しているわけではないのです。

この例ほど極端でなくても、たとえばピアノにはたくさんの種類があるので、 音源をつくる人がどのピアノをモデルにするかにより、 できあがった音源の1番の音色は変わってきてしまいます。 このことはインターネット配信するゲームなどでは重要なことで、 実行環境により音楽の雰囲気が変わってしまったり、というのは、 音楽を売りにしたいような場合は致命点になりかねません。 音源のメーカーが変わると互換性は無い、くらいに考えたほうが良いでしょう。

余談になりますが、MIDI音源の音色は、たいていどれも軽薄な感じがします。 恐らく上記のような状況を避けるためでしょうが、 このことにより、重厚で深みのある音楽を再生させることが難しく、 個人的にはなかなか好きになれない音源です。


6.   まとめ


さて、いろいろな音源について書いてきましたが、 実際にこれからゲームを作るとしてどれが使えるか、というと、 現実的な選択肢としては、PCM音源かMIDI音源しか存在しません 17

。 今日のPCやゲーム機にはこれらしか搭載されていないためです。 よって、結論としては、

「楽するならMIDI、互換性重視ならPCM」。おわり(笑)。

しかしこれでは面白くありませんね。 そこで、最近の計算機は高速ですので、それを活かし、 PSG、FM音源、そしてウエーブテーブル音源を、計算によりPCM音源で 再現してしまう、という手があります。 このためのプログラムもインターネットで公開されていたりするので、 今からそういう音源の音でゲームをつくってしまうのも面白いでしょう。

ゲームにおいては、なにも音の「リアリティ」ばかり追求せずとも良いはずです 18 。 特に昨今のMIDI音源の音色を考えると、実はPSGやFM音源なんかの方が よほど豊かで心に響く音楽を奏でることができたりもします。 たしかに扱いは面倒ですが、悪い音源たちではないのですから。


文責: masa-u <masa-u@mbin.jp>
http://mbin.jp/~masa-u/


脚注

1. 最近は家電でもPCMを使っているのもあるようですが。
2. CR発振なんかを使うもの。周辺温度で音程が変わったり、個体差があったり、まさにアナログです。
3. 出力系統のこと。2チャンネルなら2つの音声が同時に出せます。
4. ほかにノイズチャンネルもあるので実際には4チャンネル。恐らく低価格化のため。
5. タイトーの「フェアリーランドストーリー」など
6. 着メロの多くがFM音源です
7. デジタル・アナログ変換器。デジタルデータである波形をアナログデータである音にするのに必要な機器です。
8. 1秒間にどれだけのデジタルデータを音に変換できるか、という数値。高いほど細やかな音が出せます。
9. ナムコの「ドルアーガの塔」、コナミの「グラディウス」、など
10. 最長256サンプル = 約32ミリ秒(8kHzサンプリングの場合) など。
11. 昔のウエーブテーブル音源と今のものとでは音作りに対するアプローチが全く異なるため、別けて解説しました。
12. 今やどこにでもあるオーディオCDは、この方式で再生されています。
13. 前に挙げたPSGやFM音源などを計算シミュレーションで再現する、なんてこともできます。
14. もちろん計算で合成しても構いません。
15. Musical Instrument Digital Interface、楽器デジタルインタフェース
16. 無くても、OSがソフトウエアでMIDI音源をエミュレートしPCM音源で再生する、という機能が装備されているのが普通です。
17. ハードウエアから設計する場合は別です。もちろん。
18. もっとも、最近はゲームも3Dばかりですので、ゲームでもリアリティ、というのが世の中の風潮なのかもしれません。