VOICEVOX

ずいぶんむかしからYoutube に動画をあげているが、まぁ、あまり意味のない動画ばかりだ。
あくまでも自分の記録を確かめるために置いてあるようなもので、実際、再生数も少ないし再生数を伸ばすような努力も全くしていない。
が、ドラレコの動画で見てほしいポイントや走っている場所の一言メモというか、豆知識みたいなのは入れたいなと、前々から思っていた。
で、やってみたのがツイートの動画というわけである。

作ってても面白いのだが、まぁとにかく調整が大変だ。
文章を入力すればそれで正しい発音になるわけではないので、一語一語イントネーションや高低を設定していく。
なので費用対効果が著しく悪いw

作った動画が一万とか二万とか再生されるならやってもいいんだけど、いいところ数十とかだからなぁ。
まぁボク自身のためにやっていると思えば、費用対効果という言葉は考えなくていいんだけど、それにしても自分のための場合なら、ほかにもっとやるべきこと(小説書くとか、ゲームつくるとか)があるだろうっていう(汗)。

しかしコンピュータで喋らせるというのは技術者の長い苦節と歴史があるのだが、家庭用のコンピュータでようやくここまで喋らせられるようになった。個人的にはもう 20 年くらいつまり 2000 年過ぎくらいにはできるだろうなんて思ってたんだけど……(汗)。初音ミクが 2007 年かぁ~。

これから AI がもっと賢くなっていけば、微調整も不要にはなっていくと思われる。
今回僕が使ってみた VOICEVOX というエンジンでは、ため息や萌え台詞(「ほえ」とか「はにゃぁ」とか「にゃ」など)、叫び系、あえぎ系は一切再現できなかった。あくまでもナレーションにしか使えない感じだ。

下の Youtube 動画は 1986 年のゲームによる音声だ。とはいえこの頃のは録音技術の一つであってコンピュータ自身が発音しているわけではない。ちなみに下のコンピュータは 8bit コンピュータで動作クロックも 4MHz。動作クロックだけ見ても今の 1/1000 くらいの遅さである(汗)。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です