おぉ、VOICEVOX、一音ごとの長さも調節できるようになってた。すげー。かなり会話のリズムが出せるようになったが……さらに調節に時間がかかるようにww
あと文節を見付けるのもうまくなっているような気がする。たぶんだけど。#VOICEVOX pic.twitter.com/3IzUzDkU1Y
— 宇奈月けやき (@UNADUKI_Keyaki) December 18, 2021
音声合成ソフト VOICEVOX の話。
人間の会話は当然だが一定の速度ではない。「こんにちは」と発言したとき、それぞれの音(おん)が発音されている時間は異なる。文字で表すなら「こんにちはー」とか「こーんにちは」とか。それによって会話のリズムや、その人の口調・クセなんかも決まってくる。
VOICEVOX は機械学習を使ってセオリーとキャラの性格による言葉遣いを元に長さを自動的に設定してくれる。決してすべての音長が一定になっているわけではない(と思う)。
それでも会話のリズムや聞きやすさ、キャラの特徴を追求しようとすると、各音ごとの長さを調節した方がいい場合もある。
その調節ができるようになりましたよ、っていうのが上のツイート。
これ、パラメータ調節は、同じセリフを自分で喋った音声とりこんで、それに合わせるとかだと、すげー楽になったりしないかね?w
喋る方が早いか、パラメータいじるのが早いか……何とも言えんが。#VOICEVOX https://t.co/KsNLrlLQiV
— 宇奈月けやき (@UNADUKI_Keyaki) December 18, 2021
ところがもうパラメータが細かすぎて、いちいちいじってられないというジレンマもある。
台詞一つ一つのしかも一音一音に、高低・強弱・長さまで設定していたら、時間がいくらあっても足りない。なので違和感を感じたり、もしくは是が非でもここは長さを変えたいというような時につかうと良いのだろう。
あとはマイクで入力した文字を喋るとその音声データから高低・長さ・強弱を拾って再現してくれると、この辺のパラメータは一気に楽に解決出来ると思う。
これは音楽の世界でもいえることだが、音楽の世界では実際にギターを弾いたり、鍵盤を弾いたりしたデータを取り込むことによって、高低・強弱・長さといった細かいパラメータ設定を実現している。
イベントキャラ、2キャラ出た。
うれしいけど、SSSキャラの時はなぜ出ないのか……#ディスガイアRPG pic.twitter.com/U0QehfT2nI— 宇奈月けやき (@UNADUKI_Keyaki) December 17, 2021
いいかげんまだ続いている某ゲームだが、なんと、当たりキャラが二人も同時に!
一人は戦闘中の賛美歌を歌うアニメがかわいいのよ。
もう一人はおっぱいが大きい(いや、歌う子もおっぱいは大きいのだが)。
どっちも観賞用のキャラである(要するに、あんまり強くない)。
どうでもいいが、前にも話したかもしれないが、ガチャで出た女キャラは、もうボクと肉体関係があるっていうことでいいよね?<キモい
だからパーティ編成とかも絶対男を混ぜないようにしてる。だって混ぜたら SEX するかもしれないじゃん?<もっとキモい
キモオタここにあり!<自慢するな
- 今夜のヘビロテ -> 恋ノ花 / capsule