今、巷で話題の「VOICEPEAK」という音声合成ソフトを使ってみた

皆様初めまして、イベント部のわんこと申します。
この度、初めて記事を書かせていただくこととなりました。

今回書かせていただくのは、株式会社AHS様から発売されたVOICEPEAKについてとなります。

■「VOICEPEAK」とは?
※株式会社AHS様公式サイトより引用
『VOICEPEAK』は、最新のAI音声合成技術を搭載し手軽に読み上げさせることが可能な入力文字読み上げソフトです。
お好みの文章や言葉をテキストで入力するだけで、簡単に高品質な音声が作成できます。
感情パラメータによる喜怒哀楽の表現にも対応しています。

「VOICEPEAK 商用可能 6ナレーターセット」には6人のナレーター(男性3名、女性3名)に加えて幼い「女の子」の声も収録されており、様々な声のバリエーションで読み上げが行えます。

個人ユーザー様のご利用はもちろん、教育機関の方や法人様など、様々な商用・業務用途でのご利用も可能です。
※株式会社AHS様公式サイトより引用
https://www.ah-soft.com/voice/6nare/

こちらで個人的に気になったのは
“様々な商用・業務用途でのご利用も可能”
という部分になります。

実は、音声合成の商用利用というのは今までかなり厳しく、特に企業での利用を考えた場合には、初期費用として数十万円から数百万円、場合によっては一千万円くらいの金額が必要となることが多かったのです。
その常識を覆す商用利用可能。これは、かなり多くの人に衝撃を与えたのではないでしょうか。
しかもナレーター6名+女の子ボイスが収録されており、用途に合わせて選べるものになっています。
本当に15,800円(初回限定優待ダウンロード版の場合)で購入してよいのでしょうか…

■それだけでは終わらない「VOICEPEAK」の強み
ここまででもかなりのお得感がある「VOICEPEAK」ですが、それ以上に話題になったものがあります。
それが、合成した音声の自然さです。

どのくらい自然かというと、誇張なしで普通の人の声と聴き分けられない可能性があるレベルです。本当です。
もしまだ聞いたことがない方がいらっしゃいましたら、是非聞いてみてください。
現代の技術はここまで進化していたのかと強く認識させられました…

いままでの音声合成は、良くも悪くも合成特有のノイズ感・イントネーションの不自然さがどこかに存在していたものなのですが、そういったものがほぼなくなっているように感じます。

■さらに細かな部分も調整できるいろいろな機能
いままでのソフトでもあった、話す速度・ピッチなどはもちろん、感情機能についても対応しています。
難しい漢字などの読み間違いについても、下部の編集エリアから簡単に直せるため直感的でわかりやすく感じました。
さらに、アクセントだけでなくイントネーションの調整も可能で、この機能は今まであまり見ることはありませんでしたが、とても便利でした。

■総評
ここまで色々と書かせていただきましたが、一言でまとめてしまうと
「声を使う可能性のある企業は持っていて損のない一品」
という感じでしょうか。
電話ガイダンスの自動音声・自社の動画のナレーション・アナウンス音声など、幅広く活用できると思います。
弊社の音声担当も「職がなくなっちゃうかも…(笑)」と焦っていました。

■一般音声合成ユーザーとしての視点
ここからは、一個人としての意見が多くなりますので、ご容赦ください。
下記に良く感じた点・違和感を感じた点をいくつか並べていきたいと思います。
※内容は執筆時点(2022/03頃)のバージョンのものとなります。

①イントネーションの調整が非常に便利
これは、先ほどの機能の部分でも書かせていただきましたが、他のソフトにも欲しいな、と思うほどの機能でした。
この機能はどちらかというと、歌声合成のソフトにある機能に近く、自分がよくそちらのソフトを使うこともあり、嬉しい機能でした。

②ユーザーインターフェースがかなりわかりやすい
ぱっと見たときに、なにをどうすればよいのかが、かなりわかりやすいように感じました。
キャラクターは、文章の横から選ぶだけ、速度・ピッチなどは常に横に見えているので、弄りやすいです。

③やり直し(Undo)機能がある
神。

④辞書機能でイントネーションを保存できない
これは、もしかしたら何かやり方があるのかもしれませんが、頻出単語のイントネーションがおかしくなってしまった際に、現状すべてその単語のところまで行き、イントネーションを直し…とやるしかないように感じます。
ここが登録できれば、さらに便利になるかなと思いました。

⑤文末まで再生したあとの再生箇所が最初に戻らない
こちらについては以前から音声合成ソフトを使っていた弊害かもしれませんが、最後まで再生したあと、カーソルが最初に戻る気がしてしまうんですよね…
VOICEPEAKの場合、カーソル位置は再生を止めた場所となるので、最後まで再生した場合、もう一度再生ボタンを押すと何も流れないということになります。
こちらはアップデートで挙動を選べると嬉しいなぁと思っています。

⑥フレーズごとの保存機能がない
長い文章を作っていると、この部分だけ差し替えたいなと思うことがあるのですが、現状全体出力以外の選択肢が無いようです。
合成が丁寧なこともあり、長い文章になるとPCの性能にもよるとは思いますが、出力にも多少なりとも時間がかかってくるため、このあたりの挙動はユーザーによっては多少不便を感じる人もいそうだな、と思いました。

★補足
先日のイベントの際、株式会社AHSの尾形様とお話させていただく機会があったのですが、気になった部分を伝えてみたところ、なんとアップデートで解消予定(もしくは解決済み)とのことでした!
皆さんも、アップデートを楽しみに待ちましょうね!

■おわりに
さて、色々と述べさせていただきましたが、少し触っただけでも色々な活用法が思い浮かび、とても革新的なものであることは間違いないと思いました。

個人でも法人でも、是非おひとつ購入してみてはいかがでしょうか。
きっと大活躍すること間違いなしです!

以上、わんこがお送りいたしました。
また新製品が出た際にお会いしましょう!

P.S.多分歌は難しいかなって思います。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

コメント

コメント一覧 (1件)

コメントする

目次