top of page

AIに写真は作れるか?画像生成AI「Midjourney」を試す

  • tokuhata
  • 2022年8月21日
  • 読了時間: 4分

更新日:2022年8月26日


 AIに写真は作れるか。最近話題のMidjourneyを試してみました。Midjourneyはテキストを解釈して画像生成するいわゆる「テキスト画像化AI」です。代表的なテキスト画像化AIでは、Googleが開発したImagen、非営利団体のOpenAIが開発したDALL-E、そしてMidjourneyの3つがあります。MidjourneyはAIプログラムの名称であると同時に開発元の名称でもあります。これらのソフトは好ましくない使い方を避けるため現状では使用者や使用方法に制限をかけているので誰でも簡単に使えるようにはなっていないようです。この中でMidjourneyは比較的制限が緩く使いやすいのでこれを試すことにしました。


 Midjourney自体はクラウドベースのサービスですがユーザインタフェースにはDiscordというコミュニケーションツールを使用します。使用方法に関してはWeb上に各種情報が公開されているので省略し、ここでは使用してみた結果について、AIが生成する画像にはどんな特徴があるのか、今後どのように使われていくのか、その可能性について考えてみます。


Midjourneyへの指示は英語で行います。

まずは風景写真:

a photo of a winter scene of Half Dome in Yosemite National Park, background of clear sky with some clouds, and foreground of riverside with some trees and a little snowfall thereon.


ヨセミテの風景を指示したところ結果は以下の通りです。ハーフドームではなくエル・キャピタンに見えるのはご愛敬としてそれ以外の条件はかなり正確に反映しています。固有名詞を指定して描いてくれるどうかはMidjourneyが学習した膨大なデータにそれがあるかどうかに依存しますが、どうやらヨセミテは学習していてもハーフドームとエル・キャピタンの違いまでは学習していなかったようです。それ以外の条件である背景の空と雲、前景の川辺と木々、積もった雪はおおむね指示通りでイメージ通りです。4つ出力されたサンプルの中から右上を選択して解像度を上げた結果が2枚目です。Midjourneyの出力は絵画調、漫画調、イラスト調など様々ですが、今回は“a photo …” と指定したので一見写真らしい仕上がりになっています。ここまでの処理で数分です。


ree


ree

次は現実には存在しない風景を描かせてみます。

A photo of Cactus flowers blooming on the bottom of deep sea, including some deep-sea fish swimming therearound,


結果は以下の通りです。深海に咲くサボテンの花という無理な要求にもかかわらず4つのサンプル出力はいずれもそれらしい雰囲気です。しかし、入力で指定した深海魚がいません。やり直しても同じです。ちなみにMidjourneyは同じ入力でも毎回違う結果を出力します。文章を少し変えてもやはり魚は出ません。花と魚が合体しているようにも見えます。どのような学習をしたのか興味深いところです。右上のサンプルは花というよりはイクラとハマチに見えます。あるいは、イカ、タコ、イソギンチャク、ヒトデのハイブリッドの様にも見えます。花の周りを泳ぐ魚を期待したのですが、泳ぎ回る魚ではなく花と合体したような奇妙なオブジェです。左下のバリエーションを指定して解像度を上げた結果が2枚目です。魚がいないことを除けばおおむね指示通りでイメージ通りです。深海に咲くサボテンの花のイメージが出ています。想像力(創造力)に脱帽する次第です。



ree

ree

 ここでAIが画像生成するとはどういう処理なのかを考えてみます。

① 入力した指示を解釈する(テキスト入力による自然言語処理)

② 解釈した結果に基づき学習データの中から構成要素となる画像を抽出する。

③ 構成要素間の位置関係を決定しそれらを合成する


ゼロから創造しているのではなく部品となる画像、写真を組み合わせているはずです。組み合わせ方の指令を出すのは人間でありAIはそれに従い実行しているだけです。おそらく何百万点、あるいは何千万点、それ以上におよぶ膨大な画像を学習しストックしていて、ユーザが入力した指示に近い画像を選び出し、それらの相互関係を推測して合成していると思われます。上の例では花の周りを魚が泳ぐという位置関係を指示していますが、出力結果は花と魚が合体しているように見えます。このような傾向は別の投稿者も指摘しています。例えば、道具を持った人間を描かせようとしたら道具が人間の体の一部と合体してしまったというコメントがありました。このあたりの合成処理はまだ不完全ですが今後改善されるでしょう。写真としてのリアリティは高くはありませんがこれも改善されるでしょう。あえて低くしている可能性もあります。


 AIの生成物に関する所有権・著作権、さらには瑕疵責任に関しては法的解釈が難しくまだ整備されていないようですが難しい問題なので別の機会にします。著作権等の法的問題や倫理的な問題はさておき、インテリア用の絵画、広告写真、イラスト、CDジャケットのカバーデザインなどには十分使えそうなレベルではないでしょうか。





 
 
 

コメント


この投稿へのコメントは利用できなくなりました。詳細はサイト所有者にお問い合わせください。
bottom of page