注目の製品をピックアップし、Rock oNのショップ・スタッフとその製品を扱うメーカーや輸入代理店に話を聞くRock oN Monthly Recommend。今回はクリプトン・フューチャー・メディアが手掛ける歌声合成ソフトウェアの初音ミク NTについて紹介する。初音ミク NTは2020年にリリースされた製品だが、今年10月に初音ミク NT(Ver.2)のEarly Access版が公開。新エンジンと新機能を搭載し、さらなる進化を遂げている。同社の小泉聖道氏とメディア・インテグレーションの安田都夢氏に話を聞いた。
初音ミク NT
表現力を追求し、クリプトン・フューチャー・メディアが新開発した歌声合成エンジンを使用した初音ミク NT(ニュー・タイプ)。2020年にリリースされ、今年10月より初音ミク NT (Ver.2)のEarly Access版が公開されている。エディターにはPiapro Studioを採用し、多彩な編集機能やボイス・エフェクターで自在な歌唱が可能。Ver.2では新たにチューニングされたエンジンを搭載しており、専用エディターのPiapro Studio NT2ではメロディと歌詞を打ち込むだけで自動的に自然な歌唱になるよう設定してくれるAutomatic Control機能を使用することができる。Mac/Windowsに対応しており、Piapro Studioはスタンドアローンのほか、VSTとAUで動作する。
●初音ミクのボイス・ライブライリーは2016年にV4Xがリリースされ、2020年にNTのVer.1が登場しました。それぞれどのような違いがあるのでしょうか?
小泉 V4Xは名前にVと付いている通り、YAMAHA Vocaloidを歌声合成エンジンに採用しており、我々が開発したボイス・ライブラリーをパッケージして販売しています。一方のNTは、歌声合成エンジンをクリプトン・フューチャー・メディアと外部の研究機関で新たに開発して搭載しました。そこにボイス・ライブラリーを加えてパッケージしたソフトウェアとなっています。今年10月に公開したVer.2では、弊社のエンジニアが一から作り上げた歌声合成エンジンとなり、それに合わせてパラメーターも設計し直しています。
●Ver.1からVer.2にかけてもエンジンが変わっているのですね。近年は、各社が歌声合成ソフトを開発しており、AIを取り入れて生身の人間のような表現ができる製品も登場しています。シーンとして盛り上がっていると感じますが、安田さんはどう見られていますか?
安田 いろいろなバーチャル・シンガーがいますが、初音ミクは1つのジャンルとして確立されていますよね。現在に至るまで、多くのクリエイターが楽曲を作ってきて、初音ミク単独でライブを行うくらいです。一方で、AIを活用した生々しい歌声合成も進化してきて世界で注目を集めています。人間なのかソフトウェアなのか、もう聴き分けられないレベルになっていますが、初音ミクや鏡音リン・レンなど、いわゆる“ボカロ”と呼ばれてきた存在やジャンルは残り続ける気がするんです。“生々しさ”じゃない分野の人気も若いユーザー層の中にあるんじゃないかと。
小泉 その通りだと思っています。AI技術を取り入れた製品は、人間的な歌唱を追求するツールとして本当にクオリティが高くなっています。初音ミクが登場した当時、“これで仮歌が作れたら便利だね”と言われていましたが、まさにそれが実現されはじめたわけです。そんな中、初音ミクや鏡音リン・レン、巡音ルカなどのピアプロキャラクターズは、それらとは違った文化として浸透しました。ボカロPは調教や調声と呼ばれるパラメーター調整を行うことで人間らしい歌に整えていくわけですが、その過程を経ることでボカロPごとの初音ミクが出来上がっていくんです。“うちのミクさん”と表現されたりもしますからね。そういう調声する楽しみがあるのが初音ミクたちだと思うので、そのカルチャーをクリエイターから奪わないように考えて開発を続けています。
●NTにおける新しい歌声合成エンジン開発でも、その気持ちが反映されているのでしょうか?
小泉 そうですね。初音ミクらしさも保ちつつ、多彩な表現ができるように、Ver.1、Ver.2と進化しています。また、NTではパラメーター表記にもこだわっており、実際に扱うクリエイターが直感的に分かりやすい/使いやすい名称を採用しているのもポイントです。
●さまざまなバーチャル・シンガーがいる中、初音ミクの魅力はどういう部分にあると思いますか?
安田 初音ミクは一番歌を作りやすいんです。声質的に、ベタ打ちをしてもそれなりに歌ってくれる。ほかのキャラクターだと声のトーンが下がったときに粗が目立ってしまうこともあるんです。初音ミクはその声のトーンが使いやすさにつながっているのだと思います。
●これまでの初音ミクでは声の特徴ごとにデータベースが用意されていますが、NTではどうでしょうか?
小泉 Ver.1では基本となる歌声のOriginal DB+、ささやくような吐息声のWhisper DB+、哀愁漂うDark DB+があります。Ver.2は現在Early Access版ということでOriginal DB+のみですが、今後データベースの展開も考えています。
●Ver.2での新機能について教えてください。
小泉 Automatic Controlという機能が搭載されました。オンにするとピッチ・カーブやビブラート、子音長を自動で調整します。ボカロPの方々は、しゃくりやゆらぎのような人間らしいノート間のピッチ・カーブの調整を下ごしらえ的に行っているのですが、その手間をサポートしてくれる機能です。
安田 昔の初音ミクは、人間らしい歌を作るのに苦労したんです。求める表現をするためにいろいろと調べたりしなければいけなかった。Automatic Controlでは自然な表現になるよう自動的に設定してくれるので、新規ユーザーにとってとても使いやすくなっています。バリバリ使ってきた古参ユーザーにとっては物足りなく感じてしまうかもしれません(笑)。
小泉 もちろん機能をオフにすることもできますし、部分的に使用することもできます。初音ミクではさまざまな調声テクニックがありますが、Automatic Controlは良いスタート・ポイントになる存在だと思います。
●エディター上で調整できるパラメーターはどういうものがあるのでしょうか?
小泉 例えばDynamicsは音量、Note Gainはノートごとのベロシティ、Breathinessは吐息成分、Voice Voltageは抑揚や声の張り感を調整できます。Super Formant Shifterはフォルマント・シフトですが、歌声合成ソフトという特性上、変えすぎると全く別の声になりやすいです。そのため、初音ミクらしさが残る範囲で調整できるようにしています。また、Voice Driveはボーカル・エフェクターのようなものになっており、ガラガラ声やデス・ボイスといった声を再現可能です。全体的にそういった声を使うというだけでなく、一部のノートにだけ適用し、声を張ったときのビリビリとした成分を足す、というような用途にも使えると思います。
●ほかにはどのような機能がありますか?
小泉 Voice Colorという機能では、フレーズの頭だけにアクセントを付けるような表現も可能です。
安田 昔は16分や32分音符で半音上のノートを入れるとアクセントっぽくなる、というようなテクニックもありましたね。表現したいことを多彩なパラメーターで簡単にできるようになり、初心者の方は本当に扱いやすくなっていると思います。昔から使ってきた古参の人も、培ってきたノウハウというのはNTでも生きてくる気がしますし、よりよい歌声を作りやすいんじゃないでしょうか。
小泉 ボカロPの人たちによっていろいろな手法が広まっていますよね。
安田 そのおかげで、今はとても多彩な音楽であふれています。聴いていて面白いし、例えば今後、デスクトップで制作している人だけでなく純粋な演奏者の人たちがどのように初音ミクを使っていくのか、その発展も気になっています。
●初音ミク NTをどのように使ってほしいと考えていますか?
小泉 歌声合成エンジンが変わっていく中で、せっかくの歌声が変わってしまうということもありえます。でも、開発側が歌声を押し付けるのではなく、みなさんが思い描いている“らしさ”を守っていきたい。初音ミクをはじめ、ピアプロキャラクターズのイメージをしっかりと大事にしたいと考えて開発を続けています。愛されるキャラクターとしても、歌声合成ソフトウェアという楽器としても、みなさんに楽しんで使ってもらえたらうれしいです。
安田 初音ミクの登場でバーチャル・シンガー文化が生まれました。この初音ミク NTがまた新たなきっかけとなり、違う文化の誕生や発展につながっていきそうですね。そこからまた次の世代の音楽家が出てくるのが楽しみです。
Rock oN NEWS
Rock oN渋谷店&梅田店でご試聴をご希望の際は、各店舗までお電話いただくか、予約ページへアクセスし、お申し込みください。
Rock oN Shibuya:☎︎03-3477-1756 営業時間12:00-19:00(日曜日臨時定休)
Rock oN Umeda:☎︎06-6131-3077 営業時間12:00-19:00(定休日:日曜日、祝日)
※営業時間及び営業日は変更になる場合がございます