ココのところボツ原稿ばかり出していたので、一つ心を入れ替え目先を変えてみることにしてみた。ということで、まずは読者の声を聞いてみると、初心者に分かりやすい説明が欲しいという事である。うーむ、確かに昨今、マニュアルがわからない、まるで外国語で書かれた書物のようであるとの声を聞くこともある。 ふむふむ、それでは、用語の解説を含め、マニュアルやカタログにあたりまえのように書かれていることを、解説してみようではないかと一新奮起してみた。シ リーズ物になりそうなので、読者の皆様も継続して読んでくれるようお願い申し上げる。
第1回

 「MIDIはドンドドン」

第2回
 「WAVはデータ食い」
第3回
 「GM、GSそしてXG」
第4回
 「音の錬金術MP3」 ←NEW!

第4回 「音の錬金術MP3」

最近よく聞く言葉の一つがMP3である。
まるで、昔からある言葉の一つのように使われているが、実のところここ2〜3年、 やっと使われるようになったのではないだろうか。

MP3は圧縮する符号化方式MPEG-1 Audioの中のMPEG-1 Audio LayerIII の通称である。また、この MPEG とは Moving Pictures Experts Group の略で、「エムペグ」と読み、国際標準化機構(ISO)のワーキンググループの一つである。ドラエモンの七つ道具で、いろんなものを小さくしてしまう光線銃があったが、圧縮とは、まさにそういうことである。ドラエモンの道具で圧縮すると質量はどうなるんだろうと物理学思考で考えてしまうが、MP3の圧縮技術はデータの圧縮なので、
質量の法則は当てはまらない。
先日NHKのTV50周年記念の番組を見ていたら、昭和11年8月(1936)開催のベルリンオリンピックの衛星中継にも圧縮技術が使われていたというのだから、その歴史は古い。昨今の戦争報道の画像も、最新の圧縮技術で送られてきている。

第一回のWAVデータのくだりで、音声のデジタル化についてふれたが、このデジタルというのは、ONとOFFの組み合わせであるということを思い出して欲しい。インターネットにしろ、デジタル衛星回線にしろ送信している内容は、このデジタル信号、ONとOFF、つまりはスイッチを入れたり切ったりを高速で送り出しているのである。一つの映像や、音楽もこのONとOFFでデジタル化して送り出しているのだが、現在の技術フォーマット(デジタル化の考え方)では映像、音楽の情報量つまり ONとOFFの量が多いのが難点なのだ。ONとOFFの量が多いという事は、通信時間を多く必要とすることであって、それは、コストに直結する。同じ音楽を送信するにも、量が少ない方が通信時間の短縮にもなり、物理的にコストが必要な記憶媒体も少なくなる。つまり、圧縮技術とは、必要の母なのである。

MP3の場合、人間の耳の錯覚などを利用して、なんと音声の標準的フォーマットであるWAVE形式に比べて1/10にデータ量が圧縮されると言う。実際には、聴こえない範囲の音は削除してしまう、また、大きな音の直前直後にある周波数が同程度の小さな音や、大きな音の中に埋もれた周波数が同程度の小さな音などは削除してしまう、等の手法が使われている。

さらに詳しく知りたい貴兄は、インターネット上で探して見ることをお勧めする。
圧縮とはまさに錬金術のようなものだと、改めて感心するに違いない。

 

第3回 「GM、GSそしてXG」

桜のつぼみも開きかけて、このメールが届くころには、すでに満開になろうかと いう春爛漫である。さて、読者の一人から、こんなメールが届いた。

「DTM音源と音源モジュールの違いを知りたいのですが。」

ううむ。なるほどである。一体どこがちがうのであろうか。 DTM音源は、MIDIデータ制作にのっとったもの、つまりは音色の配列やエフェクター のパラメータがいわゆるGM、GS、そしてXGという仕様で装備されているものを指す。 音源モジュールは、シンセサイザーなどの音源部を独立させたものが多く、その 音色配列等は、もともとのシンセサイザーに準ずる物が多い。

そして、ここで、今まさに、出てくるのが、GM、GSそしてXGという用語なのである。

例えば、貴兄が、所有しているDTMの機材で曲を作ったとする。作りこんだMIDI データを友人に聞かせようと、作った曲をMDで録音し、録音したMDを友人に渡す。 当然、その友人は渡されたMDを自分のMDプレイヤーに挿入して、曲を聴くわけで ある。当たり前のことであるが、これならば、貴兄の曲は、そのままの状態で友 人に聴いてもらえることになる。

では、フロッピィでも、電子メールの添付データでもいいが、MIDIデータの状態で、 友人に渡したと考えてみよう。
貴兄の使っている音源機器と、友人の所有する音源機器が違った場合、貴兄が聴く "音"と、友人の聴く“音"は違ってくるはずだ。音源機器の持っている音色はそれ ぞれ違っているのだから当たり前である。

しかし・・・・である。あなたのイメージを伝えるための良い方法はないもので あろうか。MIDIのデータの中にプログラムナンバーの指定がある。音色に割り振 られている番号と解釈していただいてよい。このプログラムナンバーで選らばれ る音色が同じならば、イメージくらいは伝わるはずだ。
ピアノの演奏はピアノの音色で鳴って欲しいもの。ピアノの演奏をベースの音色 で演奏されても、なんだか、わけのわからない演奏にしか聞こえないというとい う事だ。この差を出来る限り縮めようというのが前出の、GM、GS、XGと呼ばれる ものなのである。

GMという用語は、General MIDI(ジェネラルミディ)の略語。AMEI(音楽電子事業 協会)が推奨する、ミュージックデータを制作のための音源に関する共通仕様で ある。音色は128個となっており、GM仕様音源であれば、MIDIデータを受け渡し しても、それなりに製作者のイメージがつたわるわけだ。
そして、このGM音源の規格を基本に、ローランド社が、音色、エフェクト、パー ト数などの音響効果を拡張させた音源仕様がGS、ヤマハ社の音源仕様がXGなのである。
つまりは、GS音源機器で作ったMIDIデーターを同じGS仕様音源機器で再生すると、 たとえ別品番の音源機器であっても、再現性が高いわけである。言い換えれば、 似たような音色が同じプログラムナンバーに割り振られている、ということだ。
しかし、GS仕様音源機器で作った(GS仕様音源の音色番号でつくられた)データー をXG仕様音源機器で再生すると、製作者の意図とは違った音色で再生されてしま う、といったことがおこりえる。

最後に、GM2にもふれておこう。このGSとXGに分かれた状況を統一したのがGM2と いうことだ。このような仕様の統一は、ユーザーの使い勝手を考えればありがたい 話である。



第2回 「WAVはデータ食い」

さて、前回はMIDIについて触れてみたが、今回は音声データをあらわす「WAV」という言葉について語ってみたい。

「WAV」は“ワブ”とよんで、Windowで標準的に使われる音声データの規格(フォーマット)のことを指す。WindowsでCDを焼くときも、この「WAV」ファイルを使う。蛇足になるが、「AIFF」はMacで標準の音声ファイルのフォーマット。

音声とはいかなるものか?
耳をかっぽじって聞いて欲しい。諸兄の耳の中には薄い膜のような鼓膜というものがある。空気の振動が鼓膜を震わせて人は音を感知するのである。一般 に人は、1秒間に20回から20、000回の空気の振動を感知すると言われる。ただの空気の振動を、言ってみれば“風”を,時間軸上に解析して、音楽の中の楽器音を聞き分けるのだから、人間の脳の計算処理というのは全くたいした物である。そして、この振動を音声という。

さて、パソコンやデジタル楽器で、この音声を扱う場合、デジタル化、つまり、この音声をON/OFFの信号に置き換えてやる必要がある。

突然ではあるが、パラパラ漫画を知っているだろうか?
例えば、ノートの端に数ページに渡って、少しづつ変化する絵を描いておいて、そのページをパラパラとめくっていくと、まるで絵が動いているように見える、というアレである。映画にしても、同じ原理を使っていて、1秒間に24コマの静止画を連続再生することによって、“動画”になって見えるのである。

音声をデジタル化するというのは、まさに、パラパラ漫画の“音”版そのもので、1秒間を細かく区切って(1秒間に何回も!)、その1回にどれくらいの幅で鼓膜が動いたか、という事象をデータにするということなのだ。

「WAV」ファイルは、1秒間に44,100個の音を連続再生することで「音楽」として聞かせる仕組みになっている。そして、音声データの品質を表す「16bit/44.1KHz」という言葉は、鼓膜の動いた幅を16個のON/OFFであらわし、この幅のデータを1秒間に44,100回連続再生することを表す。一般 のCDの音質が、これである。

単純計算をすると、1分のデーター量は、
16個のON/OFF×44,100回×60秒=42、336、000個のON/OFF
となり、データ処理のための補正データも入れると、1分で約10MBと言われている。

「WAV」はデータ食いなのである。



第1回 「MIDIはドンドドン」

DTMを実践するに当たって、よく聴く言葉の一つに「MIDI(ミディ)」という言葉がある。一度ならずとも聴いたことがあると思う。まさに妖怪変化なこの用語、正体は一体なんであろうか。

このMIDIは、「Musical Instrument Digital Interface」の略で、電子楽器間のデジタル通 信という意味である。電子楽器間で音の高さ、長さ、強さ、音色、効果を数値化した演奏情報を伝達するための世界統一規格なのである。こう大上段に振りかぶられても、何のことだかわからないという貴兄、恐れることはない。所詮は人間の作ったもの、決して神の所業ではない。理解できるものなのだ。

太古の昔、携帯電話なぞない時代は、太鼓の音で情報をやり取りしたと聞く。例えば、ドンドンは敵が攻めてきた!ドンドドドンは、敵は去った!。このような信号は、トンツートンと現在でもモールス信号として使われている。軍隊に入れば、覚えなければならない事項でさえある。MIDIは、このドンドンを高速で行う ものだ。MIDIは電気信号なので、1秒間に31.250回スイッチを入れたり切ったりして信号を送ることになる。余談ではあるが、デジタル通 信というものは、ただ のスイッチのON/OFFを指すことを覚えておくとよい。

例えば、鍵盤で“ド”の音を弾くと、この1秒間に31.250回の信号のうち、24個分で、これは“ド”の音であるということを示す。

ON OFF OFF ON OFF OFF OFF ON .・・・・・といった具合である。送る側と受ける側で、このON/OFFの組み合わせの内容をあらかじめ決めておけば、傍目にはただのON/OFF の組み合わせが意味を成すことになる。この組み合わせの決め事こそがMIDIといわれる規格なのだ。実に単純明快至極である。

さて、この24個をさらに分解していくと、8つのON/OFFが3つで組み合わされている。最初の8つが、 この信号が鍵盤を押したぞ!という意味を示し、(KEYON+MIDIチャンネル)、次の8つは、鍵盤のどこの位 置を押さえているか(音の高低)、最後の8つは、どれくらいの強さで鍵盤を押さえたか(音の強弱)という組み合わせになっている。

もちろん、MIDI信号にもいくつか種類があるのだが、他も、基本は変わらないのである。如何であろうか?MIDIの正体を垣間見ることが出来たであろうか。