「初音ミク」とは

Blog

以前から、「YouTube」やら「ニコニコ動画」の動画サイトで、音楽関係の動画を検索すると「初音ミクに歌わせてみた」というタイトルがいくつもあって、「『初音ミク』っちゅう子はえらい誰の曲でもリクエストに応じて歌ってくれるんだな。ひょっとすると「ミクシィ」か何かで女性ボーカル志望の人たちのサークル名だったりするのかな」とややこしいことを考えたりしてました。

で、先日のスタジオの待合スペースに置いてあったマニアックなフリーペーパー「DiGiRECO」を久し振りに持って帰って読んでたら、その謎が解けました。「ボーカロイド」だったんですね。

DAWなソフトで、歌詞と音程を入力すると女性の声で発声する、と。それを踏まえて、今まで興味はあれど聴いたことのなかった「初音ミク」動画を見てみました。曲は奥田民生『30』。なるほど、まぁ予想通りな感じの出来です。

続いて椎名林檎の『ギブス』。出だしから「う~ん」な感じ。コメントも「もうちょっと感情を入れてみたら?」とか辛口なやつが流れる。「『感情を入れろ』ったってボーカロイドにゃ無理だろう」と思う。

でもよくよく考えてみると、ミクちゃんも「音の3要素」はしっかりフォローできているわけです。「音程」「音量」「音色」の3つですね。では「感情」というのはこの3つをどうすれば表現できるのでしょうか?逆から言うと、人間の歌に「感情」を感ずるのは、一体何の要素をもって感じているのか、と。

これは音楽を作る側からすると、非常に興味深い問題なんですね。何故キーボードによる打ち込みギターサウンドが白々しく聴こえるのか、というのと同じフェーズの問題です。「そりゃ確かにギターの音なんだろうけどさ・・・」という。

乱暴に言うならば、音の3要素「音程」「音量」「音色」に対してなんらかの「ズレ」が必要なんだろう、と。ギターを弾いてみると分かりますが、ピックで弾く限り複数の弦は絶対に同時には鳴ってないんですね。上から振り下ろすと6弦からヒットして次に5弦に当たる(1弦からだっけ?)。ぱっと聴きは同時なんですが、厳密に言うと絶対にジャストではない。音量だって、多分、弦によってバラつきがあったり、音色もよく分からない倍音が一杯含まれてると思う。ピッキングハーモニクスみたいなやつが。

要はそういう音の3要素から「はみ出した部分」が、恐らく「感情的」に聴こえるのだろうと。そういうのをコンピューターで打ち込むのは、至難の業です。「そんなことしてる暇があるなら弾いた方が(または、歌った方が)いいんじゃないの?」という感じです。

「ボーカロイド」なるソフトが一体どこを目指そうとしているのかがよく分かりませんが、なかなか難しい問題をはらんでいるといえましょう。

コメント