メタラーまとんがハイソにやらかすようです

東大理系修士卒JTBCエンジニアのハイソサイエティ(上流階級)な日常

今年は生成AIと一緒に絵を描きました【Image-to-Image, Akuma.aiを使用】

ども!絵描きブロガーのまとんです。

今年の美術部の展示会に出展する作品は、2年ほど前から話題の生成AIを使って、生成AIと一緒に描いてみました!

結果的に、なんか、2人で合作したような、独特の雰囲気の絵が出来上がりました。

やべぇ、時間がない

うちの美術部は毎年冬に恒例の展示会をやっておりまして、今年は1月中旬に開催でした。

僕は今年から部長的なポジションになってしまったので、偉そうにメンバーに指示出しとか、メーリスで連絡とかしていたのですが、肝心の自分の作品の制作時間がとれていませんでした。

「まぁ年末年始に描けばなんとかなるっしょ~」という軽い気持ちでいたのですが、いかんせん、子供たちと遊びまくっていたので、全然描けていませんでした。

気が付けば1月上旬。仕事も始まった。絵の進捗率は0%。

やべぇ、時間ない。

これはできるだけ時短するしかない!!と考え、生成AIと一緒に描くことにしました、

Akuma.aiさんのサービスで環境構築を時短

絵の生成AIは色々とありますが、今回は「絵から絵を生成する」やつを使いました。Stable Diffusionの「Image-to-Image」です。

ただ、生成AIを使うには、基本的にはGPU搭載のつよつよPCと環境構築が必要です。

よくあるのはGoogle colabの環境で立ち上げるやり方ですが、今回僕はとにかく時間がなくて、すぐに絵の制作に取り掛かりたかったので、お金で解決することにしました。

Stable Diffusion web UIのクラウド版みたいなやつ「Akuma.ai」ベータ版開始! |Akuma公式

Xで見かけた「Akuma.ai」さんのサービスを使いました。

Akuma.aiは、Stable Diffusionをブラウザ上で使えるようにしてくれるサービスです。Image-to-Imageにも対応していました(2024年1月時点)。ユーザーはアカウントを登録するだけで、すぐに生成AIが使えます。計算資源はサーバー側にあるので、ノートPCでもサクサク使えます。

料金は、画像を1枚生成するのに1クレジットがかかります。初回は25クレジットが無料です。クレジットはサブスク制で、月10$で300クレジット、月15$で900クレジット、月30$で2000クレジット付与でした。

今回、とにかく絵を早く完成させたかったので、15$で900クレジット分を買いました。約2000円で絵が完成するのなら安いモノだろう。

Image-to-Imageで描いてみる

というわけで、描いてみました。

今回、夏の盆踊りで踊る長女と次女を描いていきます。描きたい絵のイメージは頭の中にありました。そこで、パーツごとに分けて描いていくことにしました。

まずは、絵の心臓となる、人のパーツです。

ラフ画を用意

時間が無いので、ペイントのお絵描きのように、線でザッと書いて、バケツツールで色をざっと塗りました。

団扇(うちわ)を持って、青いワンピースを着て、右奥を向いている長女です。

ラフ画はいつもの制作道具(SurfaceGo2とクリスタ)で描いています。

生成していく

とりあえずラフ画をpngで保存して、Akuma.aiにアップロードして、デフォルト設定のまま生成してみます。

うお!いきなりすごいのがでてきたな。なんだ、このセクシーなネエちゃんは。

ていうかなんで猫耳がついているんだ?と思ってプロンプトを見たら、納得しました。デフォルトのプロンプトは下記にようになっていました。

masterpiece, best quality, ultra-detailed, illustration, (1girl), beautiful detailed eyes, looking at viewer, (close up:0.8), pink hair, shy, cat ears

訳すと、「傑作、最高品質、超詳細、イラスト、(1人の女の子)、美しい詳細な目、ビューアを見つめる、(接写:0.8)、ピンクの髪、恥ずかしがり屋、猫耳」となります。

なるほど、プロンプトに「猫耳」が入っていたからこうなったのか。プロンプトが重要なようだ。

(ちなみに、モデルはAnyLoRAというのを使っていました。AnyLoRAを使うとアニメ美少女っぽい絵になるようです。)

 

では、プロンプトを変えてみます。

masterpiece, best quality, ultra-detailed, illustration, (1girl), beautiful detailed eyes, looking at viewer, (close up:0.8), black hair, laugh, light blue dress, sneaker, 5 years old,

訳すと、「傑作、最高品質、超精細、イラスト、(女の子1人)、細かく美しい目、見る人を見る、(クローズアップ:0.8)、黒髪、笑い、水色のドレス、スニーカー、5歳」です。猫耳を消して、年齢とか服装とかを具体的に指定しました。

おぉ!かなりイメージに近づきました。体形とか服装は、描きたい長女のイメージ通りです。顔がアニメ顔になってしまうのは、AnyLoRAモデルを使っているのでしゃーない。

ただ、団扇がなんか炎魔法のエフェクトみたいになっているのは、なんとかしたい。

 

ここで、「i2i強度」というパラメータが設定できることに気が付きました。元の絵から、どれぐらい生成AIで改変するかを調整するパラメータです。これが0.7になっていました。これをちょっと調整して、0.59にしてみます。

おぉ!!かなりイメージ通りになりました。

ラフ画での姿勢とか服装はほぼそのままで、仕上げを生成AIにやってもらったような感じになりました。

プロンプトは下記。

masterpiece, best quality, ultra-detailed, illustration, (1girl), black hair, light blue dress, sneaker, 5 years old, looking behind the page, holding a fan

「傑作、最高品質、超詳細、イラスト、(女の子1人)、黒髪、水色のドレス、スニーカー、5歳、ページの裏を見て、団扇を持っている

「団扇(うちわ)」の英語役として「fan」で伝わるか不安だったが、なんとか団扇を生成してくれました。

ただ、どうしても調整できなかったのは、顔の向きです。

本当は今回、顔を紙面の奥を向かせて、顔をあえて描かないポーズにしたかったのですが、どうしてもこっちを向くポーズが生成されてしまいました。

たぶん、今回使ったモデルは「人の顔をバシッと描く」系のモデルだったのだと思います。「顔を紙面の後ろに向かせる」というのを許してくれませんでした。

もしかすると、生成AIは「顔をあえて描かない」のが苦手なのかもしれないな、と思いました。

こちらは別に生成してみた絵ですが、良く見ると、登場人物全員がこちらを向いています。後ろを向いている人がいない。これが生成AIのちょっと不気味なところなのかもしれないなと思いました。

細かいところを調整

さて、先ほどの生成画を最終形として採用することにしました。

最後にクリスタで少しだけ修正しました。

修正点は下記。

  • 目線が後ろを向いていたので、前を向くように目の光彩を描き直し。
  • 右肩がよく分からないことになっていたので、髪と服をハッキリ描き直し。
  • 右のツインテールの髪ゴム(白)を手書きで追加。

これで長女が描きあがりました。ラフ画を描いてから1時間ぐらいの作業時間でした。

次女も描く

次女も同じように生成して描きました。

「顔を描かないポーズ」は無理だと分かったので、開き直って、顔をまっすぐ描くポーズにしました。

うん!可愛いくてイイネ!

ちなみに靴が黄色いのは、ドクターイエローのスニーカーを履いているからです。

背景を描く

背景は自分で描くことにしました。(背景も生成AIで描こうとしたのですが、全然思い通りになってくれなかったので、自分で描いた方が早いと思って自分で描きました)

ラフ画と同じ要領で、ペンとバケツツールで背景をばばっと描き、生成した長女と次女を重ねました。

この時点での僕のイメージは、「2人の画家さんが共同で描いたような絵だな」という印象でした。プロの絵師が主役の女の子を描いて、素人の小学生が背景を描いたような感じ。

でも、この時点で展示会の締め切り0日前だったので(既に間に合っていない)、もはや、描き直すとか贅沢なことは言っていられませんでした。

このまま、なんとか完成に向けてブッこむことにしました。

クリスタの力で全体のテイストを揃える

とにかくこの、背景の「素人感」をなんとか消せないかと思って、「クリスタ 仕上げ」とかでググって、下記サイトに巡り合いました。

www.palmie.jp

このサイトに書いてあるとおり、影を付けたり、ライティングしたり、コントラスト調整したり、乗算だのオーバーレイだの、ガチャガチャやっていると、良い感じにまとまりました。

最終的にこんな感じになりました。

盆踊りのやぐらを光源として影をつけまくったのですが、生成AIの部分と背景の人物の部分にどちらも同じように影をつけることで、ちょっとだけ両者が「あゆみよった」かなと思います。

それでも、やっぱり「2人の画家が描いた」感は残っているなぁと僕は思いました。

 

今年の美術部の展示会は、これをキャンバスプリントで印刷して展示しました。

f:id:highso:20240203231951j:image

生成AIと一緒に絵を描くのは初めての体験でしたが、楽しかったです!!

みなさんも是非使ってみてください。

 

以上、メタラーまとんでした。

ではでは。

 

↓過去の作品

highso.hatenablog.com

highso.hatenablog.com

highso.hatenablog.com