AIでの画像生成は使う人間の指示次第

AIに画像を生成させる場合、できるだけ具体的に指示したほうが、より自分のイメージに近いものができあがります。まあ、当たり前のことですが。
例えば、「買い物をしている小学生のイラストを描いて」と注文して生成された画像がこちら。

20251010boyatshop0.jpg

英文の看板が下がっていることとあいまって、英会話テキストの挿絵みたいですね。実を言うと、頭の中では遠足のお菓子を買いに初めて一人で買い物に来た小学生(低学年)をイメージしていました。初めての買い物で、ワクワク感と緊張感を醸し出しつつ、買うものを選んでいる……という感じで。でも、そんなことは、命令文にはまるで書かれていませんからね。

そこで命令文に追加したのが以下の事項

・小学2年生の男の子
・遠足のおやつを買いに、初めて一人で買い物に来ている
・ワクワクすると同時に緊張した表情
・場所はコンビニエンスストア
・他にも同じくおやつを買いに来た小学4年生女子の二人組が楽しそうに話している
・文字は入れない

で、出てきた画像ですが……。

20251010boyatshop1.jpg

大人に買い物を頼まれて来た子どもが「あとは何を買うんだっけ?」と言ってる図に見えます。買い物かごも、今どき見かけない籐編みみたいでおかしいです。背後の女の子もまったく同じ顔なのは変ですね。双子かもしれませんが。
そこで、命令文を追加しました。

「買い物かごはいらない・買い物リストの紙もいらない・後ろにいる女子ふたりがまるで同じ顔なのは不自然なので修正」

20251010boyatshop2.jpg

だいぶイメージに近づきましたが、男の子の表情が嬉しさだけで緊張感がありません。

「男の子の表情に、もう少し緊張感がほしい」と注文を出したら……。

20251010boyatshop3.jpg

たびたびの修正指示にAIが苛立っているのでしょうか。男の子が怒った顔をしていますよ!

「緊張感というよりも、怒っているように見えます。緊張感を出してください。」とお願いしたら……。

20251010boyatshop4.jpg

なんとも言えない、とぼけた表情です。アメリカのコメディドラマに出てきそうですね。
「おいおい、まいったね、こりゃあ。今夜は神様のご加護は期待できそうもないぜ」なんて。

そこで「楽しみの中にも緊張している感じ、です」と、再々々々々度の修正指示。

……七五三で撮った写真みたいに、しゃっちょこばっちゃいました。

20251010boyatshop5.jpg

どうやら、再々修正くらいが「まあまあ」合格でしょうか。それでも自分が描くよりは遥かに、少なく見積もって百万倍くらいマシな絵ができました。

この記事へのコメント