Ci flower デビュー 〜CeVIO AIの新ボーカリスト誕生の経緯とその魅力に迫る

Ci flower デビュー 〜CeVIO AIの新ボーカリスト誕生の経緯とその魅力に迫る

株式会社インクストゥエンターから、AI技術を用いる音声創作ソフト、CeVIO AI(チェビオエーアイ)の新たなソングボイス、Ci flower(シィ フラワ)が発表された。Ci flowerはガイノイドがリリースしている人気キャラクター、flowerの公式ライセンス商品で、flowerの“もう一つのif”と銘打たれ、ビジュアル・イメージも新たに誕生したキャラクターだ。当記事では、“CeVIO AIとは?”“Ci flowerとは?”を紹介するとともに、開発ストーリー、さらには今を時めくクリエイターはどのように使用するのかまで徹底取材。CeVIO AI、ならびにCi flowerが内包するその魅力をぜひ感じ取っていただきたい。

CeVIOとは?

 UGC(User Generated Contents:ユーザー生成コンテンツ)を支援し、新しいエンターテインメントを創出するために各分野の優れた会社が集まってできたプロジェクト。魅力的なキャラクターを生み出す映像・音楽のクリエイター集団と、豊かな感情表現が可能な音声合成技術・歌声合成技術を持つ技術者集団の融合によって誕生した。

 CeVIO AIは、AI技術により人間の声質・癖・歌い方・話し方を高精度に再現する新世代の音声創作ソフトウェアで、2021年にトークエディタとソングエディタが発売。「さとうささら」や「すずきつづみ」といったCeVIOプロジェクト制作のトーク/ソング・ボイスのほか、サード・パーティ制作のボイスも数多くリリースされている。

CeVIO AI|ソングエディタ:10,780円、トークエディタ:9,020円

CeVIO AI|ソングエディタ:10,780円、トークエディタ:9,020円

REQUIREMENTS
●対応OS:Windows 10/11(64ビット) ●CPU:INTELまたはAMDデュアルコア・プロセッサー以上(4コア以上を推奨) ●メモリ:4GB以上(8GB以上を推奨) ●HDD:1GB以上の空き容量(インストール用) ●メモリ:4GB以上(8GB以上を推奨) ●グラフィック:1,280×720以上(フルカラー) ●その他:音声再生にWindows対応サウンドデバイスが必要。ライセンス認証やアップデートのため、インターネット接続環境が必要。1ライセンスにつき1台のコンピューターで使用可能

Ci flowerとは?

 ロックに特化したガイノイドの人気キャラクター、flowerの公式ライセンスを受けて発表されたソングボイスで、これまでのflowerと同じ人物により収録された音声を元に開発が行われた。コンセプトは“並行世界に存在する新たなflower”。バルーン「シャルル」やChinozo「グッバイ宣言」など、長くボーカリストとして愛されるその魅力を継承しながら、CeVIO AIのAI技術でさらにナチュラルな歌唱を実現している。

 メイン・ビジュアルを手掛けたのは、イラストレーターのおぐち氏。カラーや髪型などを踏襲しつつ一新されたキャラクター・デザインは、人間的でエモーショナルな歌を表現するCi flowerの特徴を表している。第一線で活躍するクリエイターだけでなく、これから始めたいという方でも多彩に制作可能なソングボイスだ。

Ci flower限定グッズ付ソングスターターパッケージ

Ci flower限定グッズ付ソングスターターパッケージ:21,780円
●インストール用 Disc (CeVIO AI ソングエディタ+Ci flowerソングボイス)
●キャラクターアクリルスタンド
●三方背ボックス
※在庫が無くなり次第「Ci flower ソングスターターパッケージ」に変更

Ci flowerソングスターターパック DL版:20,900円
●CeVIO AI ソングエディタ+Ci flowerソングボイス

Ci flowerソングボイス DL版:10,780円
●Ci flowerソングボイスのみ

Chinozoに聞く! Ci flower & CeVIO AI活用術

 2020年に発表した楽曲「グッバイ宣言」が、YouTubeの1億回以上の再生回数を誇るクリエイターのChinozo。同楽曲のほか数多くの作品でflowerをボーカルとして採用する彼に、今回Ci flowerを使用してもらった。制作に使用しているCeVIO AIの特徴と併せて、その印象を聞いた。

Chinozo

【Profile】関西出身のボカロP。15才から音楽を始め、バンド活動を経て、2018年よりボカロPとしての活動を開始。クロスオーバーな楽曲を多数作成し、“中毒性がある”“メロディが良い”と評されており、海外リスナーも多い。代表曲「グッバイ宣言」「エリート」など

“花ちゃん、歌が上手になったね“と強く感じました

 僕は普段からCeVIO AIをよく使っていて、特にソングボイスの「音楽的同位体 可不(KAFU)」を使って曲を作ることが多いです。作品として世に出ているものはもちろん、制作ではまずメロディとして仮歌を作るところから始めることも多く、その際にも役立ってくれています。メロディのMIDIノートを打っただけの、いわゆる“ベタ打ち”の時点でも、かなり歌ってくれるんですよ。歌詞がまだできていないときに、これまではソフト・シンセを仮のメロディとして鳴らしていたのですが、CeVIO AIは“あああ”みたいに適当に入力しただけでもちゃんと歌になるので、制作する上でのテンションを上げてくれますね

 操作方法もシンプルな設計になっていて、音声合成ソフトを初めて使う方にもすごく使いやすいと思います。個人的には、パンがいつでも操作できるような位置にあるのがすごく便利です。歌を重ねるときにコーラスをセンターに置くことはまず無いので、段階的な操作だったり、DAWソフトに入れてから調節したりしなくて済むので、重宝しています。

 これまでflowerをソングボイスに使った楽曲を幾つも発表してきましたが、今回CeVIO AIのAI技術で動くCi flowerがリリースされると聞き、とても興味がありました。これまでよりビジュアルが大人になったような印象でしたが、まさにそのイメージ通りの歌声でしたよ

 自分の楽曲でボーカリストにflowerを採用する場合は、ギターのフィーリングを前面に出した、速いテンポのロックな楽曲に使うことが多いです。歌にアタックがあって、中域の強さで芯がしっかりしている。少年と少女の中間のような、中性的な魅力を持っている歌声なのも、とても好みです。その上で、Ci flowerの歌声は歌い方に変な癖が無くベタ打ちでも十分で、だからこそ独自のカラーも出しやすそうだなと思いました

 僕はflowerのことを親しみも込めて“花ちゃん”と呼んでいるのですが、今回Ci flowerを使ってみて、“花ちゃん、歌がすごく上手になったね”と。僕は楽曲を制作する上で、歌心や歌のグルーブをとても意識しています。CeVIO AIはグルーブをすごく作りやすい構造だし、Ci flowerの抜けのある歌声は、これから大いに活躍するのではないでしょうか。

Chinozo実践! Ci flowerの調声テクニック

 ここからは、「グッバイ宣言」のサビ部分のボーカル・データを元に、Ci flowerでボーカルを再現し、Chinozoが実際に使用しているという調声テクニックを公開! 楽曲制作の要となっているのは歌のグルーブと語るChinozoは、いかにCeVIO AIを活用しているのか。ぜひ参考にしてもらいたい。

母音をカットして歌のグルーブを演出

 僕は歌を入力するときに、自分で歌いながら調整するという過程を大事にしています。単純に歌詞を入力するだけだと、入力した言葉と実際に聴こえてくる歌の音節が違っていることもありますよね。そういうミスを防ぐためにも、ゆっくり歌ってみながら音節を抜き出していきます。

母音をカットして歌のグルーブを演出

 その上でよく行っているのが母音のカット。赤矢印部分は本来“s,u”となっているはずなのですが、後ろの“u”をカットしました。自分で歌っているうちに“す”とはっきり発音していないなと感じたら、画面下のアルファベットのテキストを選択して調整します。特にサ行で行うことが多いですね。こうすることで、より人間らしくグルーブのある歌を演出できます。ピアノロール画面にアルファベットが表示されているので、気になったらすぐに調整可能です。

強調したい歌詞にピッチでアクセントを付ける

 CeVIO AIはベタ打ちでも歌になってくれますが、自分のカラーを出したいということもあり、特にピッチ調整を多用しますね。サビ頭の“ひきこ”の“こ”はベタ打ちのピッチ(緑色の線)だと後ろが下がっていますが、逆にアクセントにしたいと思い、ここではピッチを上げています(黄色の線)。視覚的にも分かりやすいので、図工のように歌を作れます。

強調したい歌詞にピッチでアクセントを付ける

 ちなみに、Ci flowerの声質のパラメーターは、僕の好みだと全下げの−1.00です。もちろん楽曲によって、クリエイターによって好みは変わると思うので、ぜひ皆さんもCi flowerを使って楽曲を制作してみてください!

開発者が語る!CeVIO AI & Ci flower誕生秘話

 Ci flowerはいかにして誕生したのか。また、CeVIO AIに搭載されているAI技術を用いた音声合成とは一体どのようなものなのか。Ci flowerの内部とも言える音声合成エンジンを開発した、テクノスピーチ代表取締役、大浦圭一郎氏に詳しく話を伺った。

大浦圭一郎

【Profile】1982年生まれ、愛知県出身。名古屋工業大学大学院博士後期課程在学中に音声合成の研究をする傍ら、株式会社テクノスピーチを創業。卒業後、研究員として同大学の音声合成の研究に携わる。現在、同大学院客員准教授を兼務。

AI技術の進化により生まれたCeVIO AI

 まずCeVIOプロジェクトがどういったものかを説明すると、弊社テクノスピーチを含む5社が委員会方式のように関わっていて、それぞれが役割、担当を受け持っているような形です。その中でテクノスピーチは音声合成技術を担当しており、CeVIO AIや前身に当たるCeVIO Creative Studioに技術提供してきました。

 音声合成とは、文字を声に変換すること。人間の口に当たる部分の機能ですね。歌詞を入力した音符を打ち込むと歌を歌いますので、その場合は歌声合成と呼ばれています。そういった音声合成のAI技術を開発したり、プログラムのモジュール、部品を開発してCeVIOプロジェクトに提供するのがテクノスピーチの役回りです。

 プロジェクトは10年ほど前に立ち上がったのですが、2018年ごろからAI技術の精度が上がったこともあり、メジャー・バージョン・アップしようということでAI技術の提供を始め、2021年からCeVIO AIの販売が開始されました。CeVIO AIは“音声創作ソフト”と銘打っていまして、文字を入力してキャラクターにしゃべらせたり歌わせたりというのを、一つのソフト上でできるようになっています。

 10~20年ほど前の音声合成は、音をつなげるという作り方がメインでした。昔のSF映画の“ワレワレハ、ウチュウジンダ”みたいな、一聴して人工だと分かる声ですね。具体的には五十音を一つ一つ収録して、うまくなじむようにクロスフェードさせて音の波形をつなぎ合わせると音声に聞こえるというものです。

 それからAI技術が発達し、研究分野でディープ・ラーニングが主流になってきたのが2010年代ごろ。つまり波形を接続するのではなく、AIに学習させることで音声を再現するという方式が主流になりました。入力したテキストが伝わればいい、楽譜を歌えればいいというのがメインの目的だったのが、ニーズが多様化したことで学習した音声のしゃべり方や歌い方も含めて再現してほしいというものになったんです。

 CeVIO AIは、ボイスごとに歌い手の方の癖や歌い方を再現するという面においては飛び抜けているソフトだと思います。例えば、フレーズを歌った後に“フッ”というような息が入る人や、ロングトーンの後半にピッチが下がるような人とか、そういった歌い手ごとの人間的な癖は、各ボイスでうまく再現できているのではないでしょうか。

テクノスピーチのバーチャル・オフィスの様子。歌唱データの採譜担当、AIのラーニング担当など、工程ごとに担当が分かれているそう。コロナ禍以降、業務はリモートで行われており、全国各地にスタッフがいるとのことだ

テクノスピーチのバーチャル・オフィスの様子。歌唱データの採譜担当、AIのラーニング担当など、工程ごとに担当が分かれているそう。コロナ禍以降、業務はリモートで行われており、全国各地にスタッフがいるとのことだ

CeVIOプロジェクトの組織図。テクノスピーチを含む5社が委員会方式のように関わっており、それぞれが得意とする分野を担うことでプロジェクトを展開している

CeVIOプロジェクトの組織図。テクノスピーチを含む5社が委員会方式のように関わっており、それぞれが得意とする分野を担うことでプロジェクトを展開している (https://cevio.jp/about_cevio/

30~40曲の歌唱データをAIに学習させる

 Ci flowerについてお話する前に、ソングボイスをどのような手順で作っていくかをお伝えします。最初は音声提供者の歌い手の方に、歌を収録してもらうところからです。単語を一音ずつ録ってもらうというものではなく、一般的なJポップを30~40曲、時間にして合計で2時間半ほど歌っていただきます。

 データがそろった後は、AIの学習を行っていきます。楽譜を歌声に変換するAIを学習させるためには、歌声とその歌声に対応した歌詞付き楽譜が必要です。こういう入力があったら、こういう音を出す、というペアですね。そのために歌唱データを聴いて、歌詞付きの楽譜に起こすという作業を人力で行っています。

 そのペアをAIに渡していきます。最初は赤ちゃんみたいなものなので音が全然出ませんが、何度も繰り返すことで徐々に、“この音符でこういう歌詞が来たら、こういう音を出せばいいんだ”というのが分かってくるんです。その作業を100万回くらい繰り返すと、今まで渡したことがない楽譜でも歌えるようになります。これはニューラル・ネットワークという人間の脳を模倣したものを用いたディープ・ラーニングの一種で、ひたすら正解の刺激を与え続けて情報をためることで、神経が“こう動けばいいんだ”と判断できるようになるという方法を用いています。Ci flowerでは、歌唱データをいただいた後、楽譜の作成からラーニングを大体2~3カ月ほどかけて行いました。

 それから音声のチューニングです。Ci flowerの場合、主にフォルマント、声質の調整を行いました。DAWで言うところだと、EQのアナライザーを見ながら左右に山をずらしていく、というような操作に近いイメージですね。最終的にはCi flowerのビジュアル・イメージに合う歌声が出来上がったと思います。

 これから初めて音声合成ソフトを使われるという方には、CeVIO AI自体が手に入れやすい価格帯なので導入しやすいのではないでしょうか。ボイスもいろいろな種類があるので、好みに合わせて選べるというのもいい。曲を作る中できっと“この曲ならこの人の声が合いそう”みたいに感じることが必ずあると思うので、その選択肢にCi flowerも出てきてほしいですね

製品情報

関連記事