日本の風景にもすさまじく強い
Imagen 3は、日本の風景にも強いことも話題になりました。実際に「日本の雨あがりの坂のある街」をテーマに画像を生成してみたところ、いかにも日本のどこかにありそうな風景画像が生成されました。雨が降ったあとの路面の光沢感にしても、歩道の行き先が、別の曲がった道につながっているように見えるのも、他の画像生成モデルでは見たことがない特出したクオリティーの高さです。
もちろん、細かいところを見ていくと柱の位置がおかしかったり、道幅に対して柱の置かれている場所が変だったり、遠くの町並みの過密度が高すぎる気もしますが、神奈川あたりのような雰囲気で、パッと見では見抜けないレベルです。これはすごいですね。
どれくらいImagen 3の性能が高いのか、他の画像生成AIとも比較してみました。Imagen 3が比較的短めのプロンプトでも画像を形成できるということもあり、より似せた画像を出すためImagen 3の画像を解析してプロンプトを作成しています。そのため、厳密には同じプロンプトの比較ではないことはお断りしておきます。
まず、OpenAIの「DALL-E 3」は、特有のイラストよりの画像で出るのですが、細かいところがぐちゃぐちゃになっていたり、行くことができない階段が生まれたり、AI特有の構造上のおかしなものが出ています。
絵的な魅力でImagen 3を上回ったMidjourneyは、確かに趣きはあるものの、沖縄あたりを思わせる風景になりました。注目すべきは、道路の左右に出ている手すりで、現実にはありえないおかしな形状をしています。これもAIで起こりがちな失敗です。
話題のオープンモデル「FLUX.1 dev」で生成したところ、日本から少し離れているような印象の画像になりました。FLUX.1は写真画像も強いのですが、筆者が1ヵ月月あまり使ってきた印象では、日本という地域性を絞った画像はあまり得意ではないように思えています。ドイツで開発されたということもあり、学習している情報のなかに、日本の画像が少ないのではないかと推測しています。
ついでなので、Xに搭載されたFlux.1の軽量版で生成された「Grok」でも生成してみました。さらに日本の風景から離れ、韓国や中国の風景が混じってきているように感じられます。やはり総合的に見て、Imagen 3の優位性を感じることができます。
この連載の記事
-
第89回
AI
OpenAI「Sora」残念な離陸 中国勢が飛躍する動画生成AI -
第88回
AI
1枚の画像から、歩き回れる“世界”ができる 来年のAIは「ワールドモデル」がやばい -
第87回
AI
画像生成AIの進化が早すぎる 2024年に起きたことまとめ -
第86回
AI
イラストに強すぎる画像生成AIモデル SDXL系「NoobAI-XL」の衝撃 -
第85回
AI
3DモデリングにAI革命の兆し 1枚のイラストから3Dデータが完成 -
第85回
AI
誰でもVTuber時代へ フェイシャルAI技術、続々登場 -
第84回
AI
画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力 -
第83回
AI
リアルすぎてキモい 動画AIの進化が止まらない -
第82回
AI
もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい -
第81回
AI
AIイラスト、こうしてゲームに使っています -
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 - この連載の一覧へ