意外と安安が悪くない件

カレーを食べるシーンを生成 AI に吐き出させるとカレーのスプーンではなくパフェとかに使う柄が長くてつぼ(掬ったモノが入る場所)が小さなスプーンが生成されることが多い。これは恐らくカレーとかシチューとかそう言うのを食べる学習データよりもパフェやプリンなどを食べる学習データが多いからなんだろなぁと予想する。

これに関連して、生成 AI は手が描けないことが多い。stable diffusion だと 2026 年でも未だにダメなんだけど、これもそもそも絵描きは手が苦手だ。ちゃんと観察してみると解るのだが、萌え系というかエロゲでも漫画でも手をちゃんと描ける人って実は少ない。なので手を描かなくて済むように構図を工夫したりしている絵描きさんもいたりする(ちなみにアニメータは手だけで何千枚も練習したりする)。
つまり AI 的にもサンプルが少ない&変な手の絵が学習されているとボクは推測している。ほんと手って難しいのよ。それはデッサンだけじゃなくて身体とのバランスもね。あと可愛く見せるには手を小さく描くっていうテクニックもあってこれがまた学習を難しくして(混乱させて?)いると思う。

下は明らかにカレー用じゃないスプーンが描かれている例。

終売が決まったビエネッタだが、案の定、どこのスーパーにも売ってない。ネットスーパーでも検索してみたが、どこも売り切れだった。う~む…やはり転売ヤーが暗躍しているのか!? 下のスクリーンショットは、ボクの車が自転車との接触事故で板金屋入りしているのだがいつまで経っても見積もりすら送られてこないのでどこにいるんだろって検索した所w

夜、晩ご飯にお肉が食べたくなって、どうしようかと思案した。肉と言ってもステーキの気分ではないなぁ……そもそももう 24 時回ってるしなどと思った。かといって吉野家や松屋でもない。そkどえふと思い立ったのが、この日記には出ていないが深夜の打ち合わせで利用した安安だ。安かろう悪かろうの店だと思っていたのだが、値段の割りには割と分厚いお肉がでてきてびっくりしたのだ。

というわけで一人焼肉に行くことにする(ぁ

深夜 24 時を回っても営業していて車が駐めやすくて一番近い安安はどうやら中村橋店のようだ。

そしたら食べ放題があった(ぁ
スープやキムチなどのサイドメニューも食べ放題なのは助かる。肉はお察しではあるものの、値段も考えれば充分だと思う。写真見ると解る通りサシも多いし。というわけで深夜に肉が食べたくなったら安安に行けば安く・たらふく食えると言うことが解った。

ようやく生成 AI に手を出す

ようやく生成 AI に手を付け始めた。個人的には遅いと思ってはいるものの、今まで手を出さなかった理由もある。

  1. レベルがまだ低い
  2. 著作権問題
  3. ローカル環境で動かしたい(18 禁問題)

実は生成 AI そのものはかなり古くから使っていた。それは Twitter のアイコンとして使用していて、Waifu.labs というサイトで生成していた。2022 年このサイトに出会ったとき、将来、ボク一人でゲームが作れるようになる時代が来るかも! って思ったものである。もっともこのサイトでは顔しか生成できなかったが。

それともう一つボクの中にあった問題が 18 禁対応だ。エロゲを作るためには性器などの表現ができないとダメなのだが、ウェブ サービス(クラウドなど)では 18 禁は NG であった。これにはもう一つ欧米では日本の萌え絵はロリと見做されているという問題もあった。たとえウェブ サービスで 18 禁が解禁されたとしても萌え絵のエロ絵を生成したり、生成データをクラウド上に保存したら垢 BAN を食らう可能性もあった。
そのため生成はローカル環境(自分の PC 内)で行える必要があった。

最後に著作権問題だ。実は AI の学習というのはとんでもなくコストがかかる。OpenAI なんかは何年も前からアジアを中心とした世界中のバイターたちを使ってタグ付けと学習をさせてきた。それこそ兆円単位のお金がかかっている。当然、個人でそんなことは不可能なわけで例えローカルで生成するとはいえ、そういった先人たちが築き上げたデータのお世話にならざるを得ない。
そんな学習データを使って作品を作っていいのか、それを公開していいのか、さらに売っていいのかという問題である。
これについては「同人にとどめること」「お金を取らないこと」「作品の内容はオリジナルに拘ること」「絵柄を特定の絵描きに似せるようなことはしないこと」でまずは使ってみようというところで現在は落ち着いている。

というわけで、使ってみた感想を簡単に。以下のレビューは①の「レベルがまだ低い」の部分に当たる。
まず使っている AI エンジンは「stable diffusion」だ。おそらくこれをつかって同人誌を作っている人はたくさんいるだろう。
最初に使ってみた感触は以下の通り。

  1. 必ず修正が必要
  2. 同じキャラクタで他の絵が生成できない
    • 同じ理由で、同じ服装やアクセサリも再現できない
  3. 生成時間は思ったより遅くない。 → 1024×1024 ドットで 10 ~ 30 秒くらい
  4. 高解像度では画像が壊れることがあるのと高解像度だからといって表現が細かくなるわけではない(遠くの背景のディテールとか服の生地や細かい模様など)
  5. 学習データが足りないため生成されないものがたくさんある(たとえば特定の場所の景色、メカ関連(車とか銃とか船とか)

結果的には絵が描ける人が使う分には非常に強力なツールになり得るが……ボクみたいな絵が全く出来ない人にはかなりハードルが高い代物だと感じた。特に 2 は致命的で、漫画をつくるにしろゲームをつくるにしろ、同じキャラクタで色々なシーンを生成する必要があるわけで、そのたびに似たようなキャラクタが生成されるまで何百枚と生成しなければならない。しかもキャラだけならなんとかなってもそのキャラが身につけているモノまで合わせようとすると同じものはまず生成されない。ただプロンプトで指定したものはちゃんと描かれるので(例えば髪飾りとか、クマさんのパンツとか)、絵が描ける人はその部分を修正すれば同じキャラクタは担保できる。

ちなみに絵が描ける人が使えばとは書いたが、まぁ Photoshop が使えて彩色が出来てちょっと絵が描ける人ならまぁまぁ問題ないと思う。

そんなわけで画像の生成 AI、とにかくいろいろ使いこなしてみて短いエロゲでも作れたらなぁと思っている。