事例画像とセマンティックラベルから
建物ファサードをAI生成する
2023.06.08
パラメトリック・ボイス 大阪大学 福田 知弘
はじめに
建築設計のプロジェクトでは、クライアント(施主)は通常、好みの建物ファサードスタイ
ルを持っていることがありますが、設計者(建築家)は専門的見地から機能的および形態的
要件を考慮して建物を提案する必要があります。クライアントの想いを具体的に吸収できて
いない中で、設計者が建物を提案しようとすればコミュニケーション・ギャップが発生して
しまい、プロジェクトを前に進めることは難しくなります。
そこで設計案を作成する前段階などで、クライアントの好みの事例画像と設計者が描いたセ
マンティックラベルから、AI(人工知能)により現実的な建物ファサード画像を自動的に生
成することを考えます(図1)。
各用語について
・スタイル:ファサード画像に含まれる見た目の特徴を指します。東洋、西洋、古典的建築
様式、モダニズム様式など。
・セマンティックラベル:画像内の各ピクセルに対する要素の区分を指します。本研究の場
合は、建物の窓、ドア、壁、屋根、外観など。
・pix2pixHD:条件付きGAN(敵対的生成ネットワーク)の一種で、画像をセマンティック
ラベルのドメインに変換し、ラベルドメイン内のオブジェクトを編集してから、リアルな
画像のドメインに戻すことができます。そのため、道路の色や建物の質感を変更する、画
像中の樹木を建物に置き換えるなどの操作が可能です。GANとは、生成モデルの一種です。
・Deep Photo Style Transfer(DPST):ディープラーニングを用いて、入力画像に他の画
像のスタイル(見た目の特徴)を付与することで、そのスタイルを考慮した新しい画像を
生成することができます。
提案方法
建物ファサードを自動生成するこの研究では、事例による画像合成の問題を解決するために、
スタイルの一貫性を保持する条件付き敵対的生成ネットワークを応用します。
図2は提案する方法の概要を示します。筆者らは、セマンティックラベル画像xと事例画像E
から最終的なファサード画像yを自動的に生成することを目指しています。画像xの役割は、
合成画像のセマンティクスをアンカーにすることです。画像Eの役割は、画像合成時にスタイ
ルを提供することであり、出力画像yは事例画像Eのスタイルと一貫性を保つ必要があります。
そのため、合成処理モデルを2つのステージに分けます。まず、pix2pixHDフレームワークを
使用して、セマンティックラベル画像xのドメインをリアルな画像のドメインに変換し、中間
段階の合成ファサードが設計されたファサードと意味的に一致することを確保します。次に、
DPSTフレームワークを使用して、前のステップで合成されたリアルなファサード画像の特徴
を提供された事例画像Eのドメインに忠実に転送し、スタイルの一貫性を確保します。
要約すると、提案した方法は、セマンティックラベルと事例画像のスタイルで拘束しながら
新たな建物ファサードの合成画像を自動生成することができます。
教師あり学習のために、建物のセマンティックに整合しペアリングされたファサードデータ
セットを作成しました(図3)。このデータセットは、国や時代が異なる住宅ファサードの
現実画像とそれに対応するセマンティックラベルがペアとなっています。セマンティックラ
ベルには、壁、窓、ドア、屋根、道路、緑などの要素が含まれています。このデータセット
を使用して、pix2pixHDを学習させることで、設計者は現実のファサード画像に対応するセ
マンティックラベルを作成することで、抽象的なレベルでの整合性を確保することができま
す。
結果
図4は、事前学習させたpix2pixHDが自動生成した建物ファサードを示しており、生成結果
の各ファサードのセマンティクスは、リアルな建物ファサードと一致していることが確認で
きます。この生成プロセスは、画像変換モデルの助けを借りて、ファサードのセマンティッ
クラベルを現実世界のファサードのドメインに忠実に転送し、建物ファサードの潜在的空間
を可能な限り写実的に位置づけることに重点を置いています。
図5は、4種類のスタイルで建物ファサードをそれぞれ生成した結果です。設計者が描いたひ
とつのセマンティックラベルが使用されています。クライアントから提供された4つの事例
は、最終出力のためのスタイルのドメインとして使用されています。合成プロセスは、西洋
風と東洋風、そして木質とレンガの壁をそれぞれ持つ小さな邸宅の初期設計に基づいていま
す。図5の結果からわかるように、要素が同じセマンティクスを持つ色変換は局所的であり、
提案方法は文脈に応じた色の変化を扱うことができます。
おわりに
画像生成AIは、AIの力で画像を自由に生成することが可能ですが、架空の画像であるならば
まだしも、設計案を作成するためには実現するための条件などを加味する必要があります。
そこで本研究では、クライアントが好む事例画像と設計者が描くセマンティックラベルを基
にして建物ファサードの合成画像を自動生成する方法を提案し、実装しました。この方法に
より、ステイクホルダー間のコミュニケーション・ギャップを低減し、設計者は創造的な行
為により時間を割くことができるでしょう。
尚、拡散モデル(Diffusion Model)をはじめとする画像生成AIの進化とコモディティ化は
目覚ましく、この1年間を振り返ってみても、より多くのユーザが気軽に使えるようになり
ました。そのことはまた、生成AIを進化させることにもつながります。よって本研究のフ
レームワークは適宜、アップデートしていく必要があります。
最後に、この研究成果は、2023年3月23日に、インド・アーメダバードおよびオンラインで
開催されたCAADRIA2023国際会議で、筆頭著者のJiaxin Zhang君が発表しまし
た(図6)*1。日々、学生たちと研究を進めながら、AX(AIトランスフォーメーション)の
波を感じています。
参考文献
*1 Zhang, J., Fukuda, T., Yabuki, N., Li, Y. (2023). Synthesizing style-similar
residential facade from semantic labeling according to the user-provided example, Proceedings of the 28th International Conference of the Association for
Computer-Aided Architectural Design Research in Asia (CAADRIA) 2023, Volume 1, 139-148.