Magazine(マガジン)

コラム

AIが使える道具になった

2023.01.13

ArchiFuture's Eye                 日建設計 山梨知彦

     図1:Stable Diffusionが生成した高層ビルのイメージ

     図1:Stable Diffusionが生成した高層ビルのイメージ


2022年は、AIがデザインの領域で「使える道具」になったことを実感した年であった。

そうした感触を得たのは、Stable Diffusionなどのいわゆる「画像生成AI」と、ChatGPTなど
の「対話型言語AI」などが公開され、インターネットを通じて僕自身が直に触り、画像やテキ
ストを生成する体験が出来たことが大きい。まだ触れたことがない方のために、ここでは
Stable Diffusion(図1)に的を絞り、僕が踏んだ手順、実際に人工知能が描いた画像や感触を紹
介したいと思う。興味を持たれた方は、是非直接人工知能に触れ、体験して頂ければと思って
いる。

■Stable Diffusion
実際に、人工知能で絵を描いてみよう。ここで紹介するのは、画像生成AIと分類されている
「Stable Diffusion」というインターネット上で公開されているオープンソースのAIだ初版
の公開がなされたのは2022年8月22日だが、瞬く間にその情報が世界に広がり、今では膨大な
数のユーザー数を誇っている。人工知能の敷居を大幅に下げ、2022年末のAIの活況を創り出す
原動力となった。

使い方の詳細は、検索エンジンに「Stable Diffusionの使い方」とでも打ちこめば情報は得られ
るが、実は初心者には少々ハードルが高い。だが、初心者が簡単に使うための「コツ」がある。
簡単に使うには、人工知能とユーザーをつなぐ適切なユーザーインターフェイス(UI)が大切
である。Windowsのユーザーならば、「NMKD Stable Diffusion GUI」を使うことをお薦めす
る。今回ここでご紹介する画像も全て、このグラフィカルユーザーインターフェイス(GUI)
を介してStable Diffusionにアクセスして描いたものであるインターネットにアクセスが出来
るパソコンを使われているならば、NMKD Stable Diffusion GUIさえインストールしてしまえ
ば、簡単にStable Diffusionにアクセスすることが出来るようになる。NMKD Stable Diffusion
GUIのインストールについても検索エンジンを叩けば日本語での懇切丁寧な解説が手に入る
ので、これらを参考にインストールしてほしい。

■使い方
NMKD Stable Diffusion GUIをインストルするとICONがデスクトップに現われるので
れをクリックして作動させる。そこで現れる画面が、NMKD Stable Diffusion GUIで、この画
面から種々のパラメーターを設定して、Stable Diffusionに画像を描かせる。

試しに、2023年の干支のうさぎを描かせてみよう。GUIの一番上にある欄に「rabbit」とまず
打ち込んで、最下段にある「Generate!」のボタンを押してみよう。人工知能はしばらくの沈
黙の後に、右側画面に何かの画像を描き出すはずだ。残念ながら現時点では打ちこむテキスト
は英文でなければならない。とは言ってもハードルは高くなく、単語を羅列すれば、AIはそれ
なりの画像を生成してくれる。先ほど「rabbit」と打ち込んだ欄に、更に単語を加えて、AIが
描き出す画像を、イメージに合わせて変化させてみよう。例えば、

・野ウサギ風にしてみたいので、「wild rabbit」に代えてみる
・さらに、手で描いたドローイング風にしてみたいので、「drawings of a wild rabbit」に代
 えてみる
・可愛さが足りないと感じたので、「drawings of a cute wild rabbit」に代えてみる
・さらに画面上にあるスライダーも動かしてみて、変化を加えてみる

といった極めて直感的かつアナログ的な操作を繰り返し10分も遊んでいると、あっという間に
100枚ほどの画像を生成してくれる(図2~6)。 同時に大まかな操作性も理解できるはずだ。
言葉の羅列から画像が生成されるため、指示に従った正確なアウトプットが出てくるわけでは
ない。AIとの対話を繰り返し、リアルタイムにアウトプットを見ながら、作業は予想外な方
句へと進んでいくことになる。アウトプットは玉石混交な状態で、最終的には人間か介在し、
評価し、1枚を選びだすプロセスが不可欠である。

 図2~6:AIが生成した大量の画像の一部

 図2~6:AIが生成した大量の画像の一部


こうした手順を実際に行い、330枚ほどのうさぎらしき画像を生成し、「年始の挨拶状向きだ
な」と僕が思った一枚を選び出し、PhotoshopとLight Roomで簡単に後処理をした(画素数が
512✕512ピクセルだったオリジナルを、ニューラルフィルターのスーパーズームを使って
3072✕3072ピクセルに拡大し、色味などの修正を行った(図7)のがこの画像だ。写実的で
面白みは無いが、少なくとも誰が見てもうさぎに見える画像といえるだろう。

 図7:完成したうさぎの画像

 図7:完成したうさぎの画像


少なくとも、僕が人間知能で描いたうさぎらしきもの(図8)よりも、うさぎらしい。

 図8:手描きで描いたうさぎらしきもの (笑)

 図8:手描きで描いたうさぎらしきもの (笑)



この状態を単純に捉えてみれば現状のStable Diffusionは画像をデザインするツールとして
は「完成度が低い」と見えるかもしれない。それは、一般にはデザインや設計とは、恣意性を
極力排除して、諸条件を満たすためにデザイナーが思い描いた唯一の答えへと近づくことが正
しい方向と考えられているからだろうこのベクトルに乗って考えれば多様化・複雑化のこ
の時代の中でもはや人間では不可能な諸条件を高いレベルで満たした「多目的最適化」を実
現することが、人工知能に期待する方向ということになる。事実、多くのコンピュテーショナ
ルデザインはそこへの到達を目指してきたし、今も目指している。僕自身も多目的最適化を目
指して、建築デザインにコンピューターを導入してきた。この視点から見ると、なるほど、
Stable Diffusionのデザインツールとしての完成度は、まだまだ低いということになるかもし
れない。

■期待外れを期待する
しかし、実際にStable Diffusionを使って画像を生成していると、多目的最適化の結果や事前
に想定している予定調和的な「回答」的な画像よりも、むしろ期待を良い意味で裏切る「思い
がけない」画像が生成されることを追い求めている自分に気づいた。誤解を恐れずに言えば、
デザインのプロセスにおけるスケッチとは、自分のイメージ通りのものを描くのではなく、む
しろ自分の頭の中にあるイメージを超えた「何か」を引き出す役割が大きいと僕は考えている
ところがある。スケッチをしつつも、自分が元々考えていたものとは違ったものを描いてしま
い、そこから、自分の想像を超えた形やアイデアが生まれる瞬間があると信じているし、そう
した瞬間こそを大事にしている。自分の思い描いていたものを正確に描くこと以上に、手が生
成したスケッチから、そこにある予想外の何かに気づき、それを選び出し、それを他者と共有
するためのストーリーを組み立てることが、デザインの重要なプロセスであると考えている、
と言い換えられるかもしれない。もしこの考えに賛同いただけるならば、スケッチをするのは
必ずしも自分自身である必要はなく、「何か」を触発出来れば、同僚でも、スタッフでも、人
工知能でも構わないということになる。人工知能を使えば、簡単に膨大な数のスケッチを作成
することが出来る。その中の一枚から、そこにある何かに気づき、それを選び出し、それを他
者と共有するためのストーリーを組み立てることが、人工知能時代のデザイナーに最も必要と
される職能や才能ではないかと僕は思い始めている。こうした視点から見たときに、Stable
Diffusionが描き出す、膨大で幅のある画像は、デザインプロセスの中で大きな役割を担いそう
な予感がしている。

■近未来都市のイメージを描く
そんな予感から、近未来都市のイメージをStable Diffusionとの対話により描かせてみたのが、
次の数枚の画像だ。それぞれの画像は100枚ほどの候補を描いたものから僕がチョイスしたも
のだ(図9~17 後処理としては、photoshopのスーパーズームでピクセル数を上げただけ
だ)。構造も、理屈も、ストーリーもないただの絵に過ぎないが、小一時間で組織事務所の建
築屋が描いたファーストスケッチとしては気が利いている気がする。たかが画像だが、これら
を人工知能を使って生成する経験を通して、幻かもしれないが、建築デザインにおける人工知
能の可能性や、多様で複雑な諸条件をハンドリングしてデザインをするための新たな糸口が見
えた気がしたのだが、皆さんはいかがだろうか? まだStable Diffusionを直接体験されてい
ない方には、先ずは体験されてみることをお薦めする。

 図9~17:Stable Diffusionで描いた近未来都市のイメージ

 図9~17:Stable Diffusionで描いた近未来都市のイメージ

山梨 知彦 氏

日建設計 チーフデザインオフィサー 常務執行役員