AIに絵を描かせる実験６

Napple
2024年4月10日
読了時間: 3分

更新日：2024年5月24日

2024/4/11

　「もしかもしか」を描かせようとした奮戦記で色々試したが描かせたい絵をAIに描かせることはできなかった。それはStable Diffusionの使い方の問題だろうと思った。そこで今回はプロンプトだけでなく画像参照や設定パラメータを変えて試した。が、やっぱりできなかったダメ推し的な実験。そして、別の観点からのAIに描かせる有用性に触れる。

第一の実験：プロンプトでどこまでやれるか

絵１：実験のベストショット

AIに投げかけたプロンプトの元となる和文

「細長い棒状の岩が海から突き出ている。岩の頂上に木製の床がつくられ、テーブルと椅子だけが置いてある。テーブルの上には蓄音器だけが置かれている。蓄音器には複雑に絡んだ管がラッパに繋がっている。頂上の床の上の椅子に人が座り音楽を聴いている。周りには何もない。誰もいない。」

実際にAIにプロンプトとして投げかけた訳文

「A long, slender rock sticks out from the sea. A wooden floor has been built on top of the rock, with only a table and chairs. There is only a gramophone on the table. The phonograph has a complicated network of tubes connected to the trumpet. People are sitting on chairs on the floor at the top and listening to music. There's nothing around. Nobody is here.」

　これは元絵を参照画像として取り込んでいるため、全体の構成や色調が近づいたという程度で、全く希望の構図になっていない。しかし、いつまでこねくり回してもこれ以上求める構図に近づく気配はなかった。

絵２：最初はこんな感じだった

AIに投げかけたプロンプトの元となる和文

「海から棒のような細長い岩が突き出している。周りは何もない。」

実際にAIにプロンプトとして投げかけた訳文

「A long, stick-like rock sticks out from the sea. There's nothing around.」

　これは元絵の参照を行わずにプロンプトだけで試したもの。その他の要素を加えていくとどんどん構図は崩れてしまった。

　絵３：元絵

　これは1974年ごろ「FMレコパル」の表紙を飾ったマルディロに影響を受けて描いた絵を2017年ごろiMac・ArtRage Studio3.5.12・Intuos pen smallで彩色して描き直したものだ。これをなんとかAIに描かせようとした。

第二の実験：パラメータでどこまでやれるか

　参照する元絵の反映度合いを調整するとこんなふうに変化する。

パラメーター：迅速な強さ（Image UrI）を0％から20％、30％、50％、60％、70％、80％、90％、100％と変化させた結果。

パーセントが増えるほど反映度合いが減少しAI独自の絵となっていく。
構図と色調が主に影響を受け、シルエットに何を満たすかが変化していく。
50％を超えるとだいぶ元の絵のイメージは崩れてくる。
70％から80％へ変わるあたりで板の間が消え別の絵になっていく。
80％以上ではどんなにプロンプトで記述しても板の間は現れなくなった。

実験一、二の結果

　プロンプトではどんなに説明を増やしても近づけることができなかった。元絵を照させるとだいぶ似た雰囲気に描くことができる。ところが元絵のシルエットが足枷となりどんなに言葉を尽くしても「岩のてっぺんの板の間」も「ごちゃごちゃ管が延びた蓄音器」も描くことができなかった。結局、今の段階では自分で描いた架空の絵をStable Diffusionを使って描かせることはできない。

第三の実験：AIに描かせる有用性

　具体的に描きたい姿を決めなければ話は違ってくる。たとえば物語を読ませて絵を描かせた時素晴らしさを実感する。それは予想もつかない絵だったりする。画像を表現する記述がなくても、書き綴られた気持ちが絵になるのはとても新鮮で感動的だ。

絵４：言葉を読んで描かせる１

AIに投げかけたプロンプトの元となる和文

「思い通りの絵をAIに描かせることは難しい。特に空想の世界は伝えることができずイライラする。ところが、日記をそのまま読ませて絵にすることができる。それは、こちらの思う通りの絵にはならないけれど、予想のつかない絵だったりする。書き綴った気持ちが絵になるのは面白い。」

実際にAIにプロンプトとして投げかけた訳文

「It is difficult to make an AI draw the picture you want it to draw. Especially when it comes to fantasy worlds, I find it frustrating that I can't really convey what I'm talking about. However, somehow you can read what you wrote in your diary and turn it into a picture. It's not the picture I expected, but it's quite interesting to see a variety of things written down become pictures.」

絵５：言葉を読んで描かせる２

It is difficult to make AI draw the picture you want. I especially get frustrated because I can't convey the world of fantasy. However, you can read the diary as it is and turn it into a picture. It may not always turn out the way you want it to, but it's interesting to see how the feelings you write become a painting.

　絵４や絵５は私が書いた言葉をAIが絵にしたものだ。しかも二つの絵に投げかけたプロンプトはほとんど同じ内容なのに異なる絵が出来上がった。自分には思いつかない構図や描き方で素敵な絵を生み出してくれる。短時間で、何枚でも、沢山描いてくれるから、いつか気に入った絵が現れるかもしれない。こんな有用なツールは滅多にない。

　だけど、何枚描かせても、次の方がもっといい絵になるかもしれないという期待を拭い去ることは難しい。その結果際限なく描かせ続けてしまう。そして最も悩ましいのは、気に入った絵が登場したけれど微妙におかしなところがあった時だ。微調整しようとするとど壺にハマる。そこが難しいところだ。

結論

　Stable Diffusionは有用なツールだ。しかし、妥協が必要だ。Stable Diffusionを使って生成する画像はまぐれの集積だ。ある程度のところで妥協しなければ際限なく画像生成を繰り返してしまう。

追記

　Stable Diffusionの使い方がもっとわかったらできることかもしれない。しかし今のところはまだ、具体的に構図が決まった絵を描かせる良い方法がわからない。短時間で、何枚でも描いてくれるから、つい描かせてしまうが、結局目指す絵にならなければその徒労感は結構なものだ。目指す絵は自分で描くほかない。

AIに絵を描かせる実験５　｜　　AIに絵を描かせる実験７