初音ミクをさわってみたよ ^^)

食わず嫌いしていたVOCALOID初音ミクをこの度触ってみました。
リアルおさわりじゃないよ。
ちょっとした自分へのメモも含めたレビューを少々。


1)入力について
完全ピアノロールウインドウ。
打ち込み方法、歌詞&発音の入力は極めて簡単で
操作的には良く出来ていると思うし、動作も結構軽い。
私はソフトレンダというか普通にオンボードサウンドマッパーで
動かしましたが大して重くもありませんでした。
(ただしCPUはCORE2DUO、メモリは2GB)


ヤマハらしいというか、画面下に出ているコントロールウインドウの
配置感覚がXGWORKS、SOLを彷彿させる感じがするのは
XGユーザーのアレでしょうかね。既にXGが死語ですが(笑


2)発音の仕組み
歌が流れる仕組みとしては、「歌詞入力」自体に音を出す機能はなく
「歌詞」を入力すると、連動して実際にライブラリを引き出す「発音」が
入力され、それが音になるという仕組み。
なので実際は2つの要素があるわけではなく、
”歌詞⇒発音に変換”するという感覚で実際は「発音入力」だけと言えますね。


これはVOCALOIDの表示上は あ [ a ] という感じで表示されます。
実際になっているのは[]の中だけ、つまりそれがライブラリの引き出し記号です。


実際歌詞を入れたあと発音だけを変えると、
歌詞と違う声が再生されてしまいます。


となると発音部分の入力について修練することが
匠となる条件かと思われたのですが、これがやっかいそうですね。
ヘルプに載っている資料(発音ライブラリの例)も正直分かり難い。


もともとは英語(アルファベット)の組み合わせのエンジンなので、
単純には日本語と発音がマッチしないものがあったりするので、
その点が不自然になる感じ。


ちなみにこの発音入力についてですが、
過去にエキサイト(Exite)という翻訳サイトだとか、
英文を発音させるウェブページとかで変な言葉を入れて
遊んでたやんちゃな人にはとっつきやすいと思います(笑)


発音させたい言葉「unko」  ⇒  外人の声で(ちょっと不自然に)「ウンコー!!」


とかね。
俺的にはこの感覚とVOCALOIDは似ている(笑)



3)コントローラー

コントローラは
1:BRE(ブレスコントロール
2:BRI(ブライトネス)
3:DIN(ダイナミクス
4:PIC(ピッチベンド)


主要にはこの4つかなという印象を受けました。
ちなみに、マニュアルなどには重要な要素だとか色々書いてますが、
あんまりデカイ意味はありません。(笑)
そこまで努力して入れても効果はほとんどないでしょう。
味付けくらいに思っておくのが正解と思います。


これは実際の製作時に使うな、という風に思うのは


?「BRI」ブライトネス
「つ」「す」など息の構成音が強いような音に対しては
を上げる事で聞こえやすくなるでしょう。
ようするにハイパスのフィルターですからね。


?「DIN」ダイナミクス
これは一般的なMIDIパラメータでいうところの
コントロールNO11・EXPRESSIONに相当します。
単純にボリュームのコントローラと思ったほうがラクです。
伸ばした声をフェードで減衰させるのにはこれが使えます。
というか他に主導的に落とす方法がないみたいです(笑)



3)問題点
あと、狙ってるのかどうなのか微妙ですが
相対でも絶対でも音感のある人がきくと気持ち悪い
チューンのズレがたまにあります。これは
なんか狙ったにしてはランダムなズレがあるため、
よくわかりませんが、解消しようと思ったら
ズレている部分にはピッチベンドを当てて修正する必要があります。


これが良いんだ(ヘタウマに聞こえて)という意見もあるようですが、
オフィシャルでこれはズレがありますが狙っていますという
表記が無い以上、不完全な出来と言えてしまいます。
せめて、ヘタウマモードみたいな変換ができるような機能があれば
そういう意味での評価はできるのですが、そういうわけじゃないしな。


4)総論
おそらく初音ミクユーザーの大半は歌詞を単純に入力するだけの
変換動作だけで歌作りしているんじゃないかなと予想。


というのは、その発音を修練することによっても、
大したクオリティ(変化というか)は得られないというのが私の予想だからです。
あくまである程度の音の連結機能を搭載したサンプルプレイバックシンセです。
ただやはり仮想ヴォーカルとしては十分機能していると思います。
もうすこし歌詞が聞き取りやすくなればもっといいんですがね。


あとはDAWにつっこんでからの編集ですね。
プラグインで空間系のエフェクトや、スライサーとか、
遊べる事は多いので、その辺の遊びが楽しそうな気がします。



やはり生物(?)はサンプルの量と質が決め手ですから、
たとえば母音・子音の連結による発音の自然さはもちろんのこと、
単語を辞書一冊分登録してあるとか、
そんなほうがより仮想ヴォーカル的なものができるでしょうね。


書いたサンプル曲ファイルを忘れてもたので後日貼り付けま