AIを使ってイラストを描いてみた

このブログではいらすとやさんの画像をよく使っています。以前は自分で描いた絵を掲載することもあったのですが、うまく描けないので、最近ではすっかりフリー素材頼りです。フリー素材はありがたいのですが、希望にピッタリの絵が出てこないこともしばしばです。
そういうときに、AIの生成画像はどうなんだろう、と思って試してみました。ちょうど昨日、女子高校生の話柄で記事を書いたので女子高校生のイラストをAIに描いてもらいました。利用したAIはGoogleのGeminiと、ツイッタ(今は「X」ですが、あえてツイッタと呼びたい)のGrokです。

ちなみに与えた命令文は以下の通り。もちろんGeminiにもGrokにも同じ文面を使っています。
----------------------------------------------
女子高校生のイラストを描いてください
ブレザータイプの制服を着用
スカートは膝が隠れるくらい
髪の毛は肩までのストレート黒髪
カバンを肩にかけている
ソフトクリーム屋の前に立っている
手にはソフトクリームを持ってる
表情は恥ずかしそうな微笑み
頭のてっぺんから靴まで全身が見えるように
画風はマンガ的に
----------------------------------------------
何度か命令文を書いたのですが、できるだけ具体的なほうがいいみたいです。なおかつ、文章というよりは箇条書きのほうが確実に条件を読み取ってくれるみたいですね。

その結果、これがGeminiによる生成画像です。

20251009girlgemini.jpg

けっこうかわいいですね。ソフトクリームが大きすぎるのと、バックの看板に「美味い」とあるのが気になります。ここはせめて「美味しい」だろう。学習した画像が「美味い」だったのかな。ラーメン屋の看板でも参考にしたのか。
それから、スカートが少し短いんじゃないか? 命令文には「膝が隠れるくらい」としてあるのですが、もしかしたら曖昧だったのかも。

こちらはGrokによる生成画像。2つも出力されましたが、まずは1枚目。

20251009girlgrok1.jpg

やっぱりソフトクリームが大きい気がしますが、スカート丈はほぼ命令文通りですね。いや、ちょっと長いかもしれませんが、それでも「膝が隠れ」ている点は合格でしょう。ただし、ベストの裾がスカートにインしてあるのはいただけませんね。さらに後ろのソフトクリーム屋さんの店舗が、まるでおでん屋の屋台然としているのはどうか。ソフトクリーム屋に圧力鍋はないだろう(笑)。看板の文字も「ソフト?レク」ってなんなのか。

そしてGrokによる、もう1枚の生成画像。

20251009girlgrok2.jpg

「全身が見えるように」という指定が守られていません。たぶんスカートは、かなり膝上でしょう。後ろの看板の文字は、すでに文字の形をしていません。まるで、ぼくが手書きで作ったようです。何度か命令文を書き直しての結果ですが、これまでに生成された画像でも看板の文字は意味不明でしたね。「ツオトクアム」とか「ソフストクリーム」なんて看板が出てきたこともありまして、日本語の文字画像の処理がまだ難しいことが伺いしれました。


この記事へのコメント

  • りんさん

    かわいいですね。AIすごい!
    わが家でも、私が書いた話にAIでイラストをつけるっていうのを、遊びでやりました。(私はできないので夫にやってもらった)
    かなりの完成度でしたよ。
    ただ、イメージ通りではなかったかな。
    しろまめさんも、やってみて下さい。面白いですよ^^
    2025年10月10日 11:44
  • しろまめ

    りんさん >>
    コメントありがとうございます。
    AIによる生成画像への指示を通じて、自分の認識と他人(ここではAIですが)の認識の違いを意識することができました。
    もしかしたら、生成画像への指示命令文(プロンプト、というのかな?)を通じて、描写力や表現力を学べる部分もあるかもしれない、ですね。

    とは言い条、ぼくの考えていることだから、たぶん間違っていますよ、きっと。

    2025年10月10日 17:13