模倣から創造へ。Lumaで拡張するデザインの可能性

こんにちは、Insight Edge デザイナーの水上(みずかみ)です。 2023年5月にジョインさせていただき、Insight Edgeが発信する様々なデザインを担当しております。

今回は、近年話題になっている3D生成AIツール「Luma」を使ったビジュアルデザイン制作について、私自身が行った実験とその気づきを交えながらご紹介したいと思います。

Lumaとは?

Lumaは、画像や動画から高精度な立体空間を再構築するAIツールです。NeRF(Neural Radiance Fields)という技術を活用し、光や質感の変化を含めたリアルな空間情報を生成できます。

最近では、「Photon」という新機能も加わり、空間だけでなく“フォトグラフィックな一枚絵”としても完成度の高いビジュアルを生成できるようになりました。写実性と構図の美しさを兼ね備えたアウトプットが可能で、他AIによるビジュアル制作と比較しても質感を感じる画像が出てくることもあります。

フォトリアルなイメージ生成や、構成のインスピレーション源としても使える点が、デザイナーにとって大きな魅力です。

未来都市のアイデアをビジュアル化する実験

今回の実験テーマのひとつが、「未来都市をLumaで描いてみる」というものでした。 頭の中にある断片的なイメージは以下です。

──高くそびえ立つ摩天楼と、空中を移動する自動車、緑に包まれた建築、浮遊する都市機能……それらを言葉で伝えるだけで、Lumaは何パターンもの世界を提案してくれました。 以下がプロンプトです。

Looking up from the street at a towering futuristic city skyline at night, with layers of flying cars moving in formation between high-rise skyscrapers. The sky is dark, illuminated by glowing streetlights floating in the air at multiple levels. The buildings are lit up with neon lights, windows glowing, creating a cyberpunk atmosphere. A dense, organized traffic of flying vehicles moves between the buildings, layered in the sky like highways in the air.

生成された未来都市イメージ

最初に表示された画像を見たとき、まずは一人で作ることができない色々なアイデアを着想させられるようなイメージが生成された印象でした。

車や都市のデザインも様々で、ビルとドッキングしそうな無機物な見た目もあれば、現代の延長線上にありそうな車のデザイン(道も物理的に走れるタイヤがある)やドローンに似た形のものもあります。

手描きや3Dで表現しようとすると膨大な時間がかかるような構図を、数分でこのレベルで出してくれることと、他AIツールにはない光の表現に目を見張ります。

ちなみに同じプロンプトをFireflyで生成すると以下になります。

Lumaにお願いすると映画のような質感のある霧やネオンの明かりがとても印象的ですが、Fireflyだとイラストのようなアナログ感がありつつ、忠実にプロンプトを再現してくれている印象でした。(Lumaはアングルなどの指定は無視で基本的には正面にカメラを構えた構図になります。)

今回は、未来の都市ということでフィクションであり、実際に誰も見たことがない景色なので、リアリティとしてそれが正しいかどうかというよりは驚くようなアイデアやイメージを膨らませるきっかけとなるビジュアル制作でした。

美しい写真を再現するアプローチ

もうひとつの試みは、既存の印象的な写真をリファレンスにして同じような構図のビジュアルを再現できるか?という挑戦でした。構図、光の入り方、空気感——それらが印象的な写真を参照しながら、Lumaでの再現を試みました。

元画像:

こちらの画像を参考にしたプロンプトは以下になります。

A surreal cinematic scene of a man in a suit standing next to a luxury car partially submerged in calm water at twilight. Behind him, a massive red sun is setting on the horizon, casting a vivid reflection on the water. The sky is deep blue with a subtle film grain texture, and a few birds are flying overhead. The mood is contemplative and mysterious, with a minimalist color palette of deep blue, black, and striking red. Retro-futuristic or neo-noir style

生成画像:

あえてかなり誇張されたイメージを参考にプロンプトのテキストのみで生成を依頼してみましたが、イメージの添付がなくても要素を整えて、イメージを共有することができました。

元画像の赤い太陽のようなライトと周囲を包む青の世界観のコントラストがかなり意図的に強調されているような印象でしたが、生成画像は生きすぎた演出を丸めて、より被写体全体を見やすく描画を変えるアレンジを加えているように感じます。

もう一つ試してみます。 元画像:

こちらの画像を参考にしたプロンプトは以下になります。

A night-time urban fashion scene with a moody cinematic atmosphere. A stylish young person with a sharp bowl haircut stands confidently in front of an old silver Mercedes-Benz. They’re wearing a shiny blue puffer jacket, crop top, and reflective light blue joggers. The background features an industrial highway overpass with dramatic orange streetlights. Cool blue and warm orange lighting creates strong contrasts, while fog or smoke adds a mysterious vibe. The person is lit from the side, enhancing the edgy fashion-forward look. The overall mood is retro-futuristic and expressive, like a still from a music video or fashion editorial.

生成画像:

こちらも画像の要素やシーンを保持し、何をメインの被写体として据えるのかということをLumaは意識して生成を行ってくれているように感じます。また、背景についても指示したものがきちんと見えるようなビジュアルに落とし込んでくれているのがわかります。

一方で元画像の意図したトリミングや構図・アングルを再現したり、背景と被写体の強弱を強調するような生成が難しいことがわかります。

Lumaを実際に試してみて、上記のように幾つかのリファレンスを元に画像を生成しようと思った際に、人間の意図したトリミングや強弱の表現、アングルなど様々な要素をある程度認知負荷の低い形へと落とし込もうという機能が働いているように感じました。

好みの問題もあるかもしれませんが、元画像は印象の強いビジュアルを選んだこともあり、制作者の意図を感じやすいものであったため、意図された演出や表現が失われてしまうことに少しの抵抗を感じつつ、アイデアを形にする速度は圧巻です。

ただ一つハードルになるのは、どれだけ具体的にイメージを言語化できるか、そしてそれがただの模倣にならないかということです。

ここまではいかに忠実にリファレンスを再現しているかということに着目していましたが、実際の制作の場では、おそらくこのようにまるっきり画像のスタイルを既存のビジュアルに寄せるということはないでしょう。必ずそこにオリジナリティや事業的な観点が入り、調整が必要になってくるはずです。

また、クリエイティブやデザインを制作する自身としても誰もがわかりやすく印象に残りにくいビジュアルより、元画像にあるような細かくても意図された人間による作り込みというものが感じられる作業があることで説得力が生まれるように感じています。

発散と収束:ビジュアル化のプロセスでの使い分け

デザインの工程では、以下の2つのフェーズが存在します。

  • アイデア発散:方向性を探る、未知の要素を発見する段階

  • アイデア収束:決まったコンセプトを精密に形にする段階

AIはどちらかというと前者の「発散」が得意なように感じました。どちらかというと表現したい世界観やイメージをすり合わせる際に今まで手書きのラフや参考画像等ですり合わせていた「頭の共有作業」をより解像度高く、世界観を齟齬なく圧倒的な情報量で伝達できる利点があるように感じました。

一方、「収束」というような実際に精度の高い調整を行ったり、商品画像のような具体的な販促物のためのビジュアル活用という意味では、再現にとても時間がかかるということも分かりましたし、人間による意図された作り込みや表現については難しいことも実際に触ることで認識できました。

正しい模倣と、デザイナーのオーナーシップ

AIが生成した画像に満足するだけでは、デザイナーとしての意味はありません。重要なのは、

  • どこまでをAIに任せるか

  • どこからが自分の編集・判断によるものか

この“線引き”を明確に持つことだと感じます。模倣によるAIと人間をつなぐ言語を生み出すことであり、あくまでそれはスタート地点で、一人のPCの中でこの時間で出力できるのは驚きの成果と言えます。

ただそれだけでは、魅力的なビジュアルであってもどこか説得力に欠けるような、コモディティ化された絵という印象は拭えないです。 どんなコンセプトとどんなビジュアルを用いるべきなのか、そこにどんなストーリーを感じてもらえるかということは人間の頭の中で構築されていくものであり、その視点できちんと何を模倣すべきかを選ぶ視点というのが人間にとって重要なステップであるように感じます。

また、出力された画像に対しても、「この構図は少し違う」「自分ならこういう表現にする」といった批評的な目利きを持つことで、単なるAI画像を"自分の作品"に昇華させる視点があり、それはAIでも調整可能なのかそれとも人が手を動かすべきなのかといった判断が入ると思います。

そういった目利きと判断力というものが人間に対してより一層求められる時代になっているというのが現状だと思います。

今後のAI活用の未来

今回の実験を通して感じたのは、AIは単なる時短ツールではなく、思考の幅を広げてくれる「問いのきっかけ」にもなりうるということです。 もちろん、出てきたものをそのまま使うだけでは、自分の表現にはなりません。 ただ、どこかで詰まりかけていた自分に机に座り続けたままアイデアを広げていくような感覚は、AIならではの面白さだと感じました。

Lumaに限らず、こうしたツールは今後ますます増えていくはずです。だからこそ、使い手としての感性や判断力をどう育てていくかが、これからのデザインにおいてより重要になってくるのではないでしょうか。 また機会があれば、他のツールや実験についてもご紹介できればと思います。 ここまで読んでいただき、ありがとうございました。