top of page

AIに写真は作れるか? 画像生成AI「Stable Diffusion」を試す

  • tokuhata
  • 2022年8月26日
  • 読了時間: 4分

更新日:2023年11月12日

 AIに写真は作れるか。続編としてStable Diffusion を試してみました。Stable Diffusion は現時点ではMidjourney と双璧といえる画像生成AIです。使い方は各種情報がWeb上にあるので省略し結果の評価を中心に述べます。入力はMidjourneyと同様英語入力です。ちなみに出力のスタイルは絵画調、漫画調、イラスト調など様々ですが筆者の興味は写真なので入力の表現に a photo, realistic, detailed, などを指定します。実在する景色や写真家の名称などを入れると効果的のようです。入力文(Stable Diffusion, MidjourneyともPromptという表現を使っていますので以下Promptとします)のコツはMENUのPrompt Guide に書いてあります。文末に要点を示します。


 まずは風景写真。Midjourney と比較する意味で同じPromptを入力してみました。結果は以下の通りです。Midjourneyよりも入力に忠実で、かつ色調や画面構成もこちらのほうがよさそうに感じます。Midjourneyはハーフドームとエル・キャピタンを混同していましたがStable Diffusionはハーフドームを忠実に再現し、背景の空と雲、前景の川と木々も概ね指示通りです。リアリティも写真に近く、色調も渋くて自分好みです。


Prompt: a photo of a winter scene of Half Dome in Yosemite National Park, background of clear sky with some clouds, and foreground of riverside with some trees and a little snowfall thereon.



 試しにPromptを変え、Yosemiteに関する単語を除いてAnsel Adams の名前を追加してみました。mountain, cloudという単語以外は抽象的な形容詞中心で構成要素の位置関係などは指定せずAIに任せてみました。アンセル・アダムスといえばヨセミテが思い浮かぶのですが、結果は意外にもヨセミテではない景色が出力されました。そして指示してはいませんがモノクロになったのは興味深いところです(アンセル・アダムス作品はモノクロが多い)。目的次第ですが事細かな指示をするよりも大雑把な指示にしてシステムに任せるほうが結果はよいかもしれません。


Prompt: beautiful mountain, dramatic clouds, soft golden light, highly detailed, photography by ansel adams, highly realistic



 次に「深海に咲くサボテン」です。Midjourneyにも描かせたので同じPromptを使います。これは安っぽい漫画レベルの結果しか得られませんでした。確かにサボテンの花に見えますがディテールも色調も安上がりで魚も不明確、深海の雰囲気も出ていません。Midjourneyの結果のほうがはるかに良いです。パーツ間の合成も雑に見えます。深海のサボテンという架空の景色ではありますが、得手不得手があるのかもしれません。


Prompt: A photo of Cactus flowers blooming on the bottom of deep sea, some deep-sea fish swimming there,



 次は星空です。結果は、写真としてのリアリティは高くないですがイラストとしてみればまずまずの結果です。背景と前景の構成要素、位置関係とも指示通りで概ねイメージ通りです。天の川の描画は実物とは細部が異なりやや不満が残ります。ここには示しませんがMidjourneyでも似たような結果が得られました。


realistic photo of starry sky in high resolution of 4K or 8K, including foreground of Mt. Fuji, and background of milky way with detailed galaxy and nebula



まとめ

Promptのコツをまとめておきます。(HPから引用)

(1)対象:「何」を描かせるかを指示します。例としては、Panda、A warrior with a sword、Skeleton、などです。

(2)スタイル:指定しないとAIが対象に合わせて適当に決めてしまいます。自分の意図がはっきりしている場合は写真風にしたいのか油絵風にしたいのかなど具体的に指示します。例えば以下です。Realistic, Oil painting, Pencil drawing, Concept art  私の例では写真風にしたかったのでA photo を指定しました。

(3)アーチスト:ユーザが想定しているイメージをAIに伝えるため、有名なアーチストの名前を加えることを推奨しています。例えば、“made by Pablo Picasso” or just simply, “Picasso” 私の例ではAnsel Adamsを指定してみました。

(4)仕上がりの調子:例えば、Highly detailed, surrealism, trending on art station, triadic color scheme, smooth, sharp focus,


 満足できる結果を得られるか否かは何を描かせるか対象の種類によりかなりばらつきがありそうです。希望通りの結果を得るためには何度か試行錯誤してシステムの癖、傾向を読み取ることが必要と思われます。今回は無償範囲での試行結果ですが有償サービスを申し込むと解像度を上げるなど質の高いサービスが受けられるようです。写真業界への影響は未知数ですが少なくとも広告写真、アートとしての合成写真(コラージュ)、カレンダー、イラスト、CDジャケットなど商業デザイン、などに普及する可能性を感じます。一方で、悪用されることへの防御策、所有権、著作権、瑕疵責任、等の法的問題への対応も整備が必要と思われ今後も注視していきたいと思います。


 
 
 

Comments


Commenting on this post isn't available anymore. Contact the site owner for more info.
bottom of page