2024/4/11
「もしかもしか」を描かせようとした奮戦記で色々試したが描かせたい絵をAIに描かせることはできなかった。それはStable Diffusionの使い方の問題だろうと思った。そこで今回はプロンプトだけでなく画像参照や設定パラメータを変えて試した。が、やっぱりできなかったダメ推し的な実験。そして、別の観点からのAIに描かせる有用性に触れる。
第一の実験:プロンプトでどこまでやれるか
絵1:実験のベストショット
これは元絵を参照画像として取り込んでいるため、全体の構成や色調が近づいたという程度で、全く希望の構図になっていない。しかし、いつまでこねくり回してもこれ以上求める構図に近づく気配はなかった。
絵2:最初はこんな感じだった
これは元絵の参照を行わずにプロンプトだけで試したもの。その他の要素を加えていくとどんどん構図は崩れてしまった。
絵3:元絵
これは1974年ごろ「FMレコパル」の表紙を飾ったマルディロに影響を受けて描いた絵を2017年ごろiMac・ArtRage Studio3.5.12・Intuos pen smallで彩色して描き直したものだ。これをなんとかAIに描かせようとした。
第二の実験:パラメータでどこまでやれるか
参照する元絵の反映度合いを調整するとこんなふうに変化する。
パラメーター:迅速な強さ(Image UrI)を0%から20%、30%、50%、60%、70%、80%、90%、100%と変化させた結果。
パーセントが増えるほど反映度合いが減少しAI独自の絵となっていく。
構図と色調が主に影響を受け、シルエットに何を満たすかが変化していく。
50%を超えるとだいぶ元の絵のイメージは崩れてくる。
70%から80%へ変わるあたりで板の間が消え別の絵になっていく。
80%以上ではどんなにプロンプトで記述しても板の間は現れなくなった。
実験一、二の結果
プロンプトではどんなに説明を増やしても近づけることができなかった。元絵を照させるとだいぶ似た雰囲気に描くことができる。ところが元絵のシルエットが足枷となりどんなに言葉を尽くしても「岩のてっぺんの板の間」も「ごちゃごちゃ管が延びた蓄音器」も描くことができなかった。結局、今の段階では自分で描いた架空の絵をStable Diffusionを使って描かせることはできない。
第三の実験:AIに描かせる有用性
具体的に描きたい姿を決めなければ話は違ってくる。たとえば物語を読ませて絵を描かせた時素晴らしさを実感する。それは予想もつかない絵だったりする。画像を表現する記述がなくても、書き綴られた気持ちが絵になるのはとても新鮮で感動的だ。
絵4:言葉を読んで描かせる1
絵5:言葉を読んで描かせる2
絵4や絵5は私が書いた言葉をAIが絵にしたものだ。しかも二つの絵に投げかけたプロンプトはほとんど同じ内容なのに異なる絵が出来上がった。自分には思いつかない構図や描き方で素敵な絵を生み出してくれる。短時間で、何枚でも、沢山描いてくれるから、いつか気に入った絵が現れるかもしれない。こんな有用なツールは滅多にない。
だけど、何枚描かせても、次の方がもっといい絵になるかもしれないという期待を拭い去ることは難しい。その結果際限なく描かせ続けてしまう。そして最も悩ましいのは、気に入った絵が登場したけれど微妙におかしなところがあった時だ。微調整しようとするとど壺にハマる。そこが難しいところだ。
結論
Stable Diffusionは有用なツールだ。しかし、妥協が必要だ。Stable Diffusionを使って生成する画像はまぐれの集積だ。ある程度のところで妥協しなければ際限なく画像生成を繰り返してしまう。
追記
Stable Diffusionの使い方がもっとわかったらできることかもしれない。しかし今のところはまだ、具体的に構図が決まった絵を描かせる良い方法がわからない。短時間で、何枚でも描いてくれるから、つい描かせてしまうが、結局目指す絵にならなければその徒労感は結構なものだ。目指す絵は自分で描くほかない。
Comments