Magazine(マガジン)

コラム

都市資源としてのテキストデータ

2018.12.25

パラメトリック・ボイス            木内建築計画事務所 木内俊克

デジタル化されたテキストデータは、情報社会における貴重な資源だ。前回コラムでも指摘し
た点だが、「検索」がインフラとして浸透して以来、私たちの思考方法やものごとへの接し方
そのものが完全にアップデートされた。そしてそのシステムを駆動する重要な資源の多くがテ
キストデータによっていると言って間違いないだろう。
ただし、では建築設計や都市のプラニングの中で、通常テキストデータにより保持されている
定性的な情報を、設計やプランニングにおいて寸法や数値化された指標と等価な客観的根拠と
して運用できてきたかと言うと、そこはなかなか難しい(主観やあいまいさが混じりがちで、
そもそも寸法のような緻密な形態の定義に落とし込みにくい)状況が続いてきたし、いまも続
いているという認識は読者の皆さんにもおおむね共有いただけると思う。もちろん、テキスト
により保持されている情報も多岐にわたるわけで、一概に一般化できない部分があることも承
知の上であえて言い切れば、人が感じる情緒的、感覚的なものごとの質を記述しようとすると、
やはり主要な媒体はテキストになり、そしてひとたびテキストとして記述された質的な情報は、
それをふたたびデザインや計画の問題に翻訳する為には、高度な専門性が必要とされる。ある
いは、高度な知見を集約してはじめて判断できるような質的な情報のデザインや計画への
フィードバックであればあるほど、デザイナーや翻訳者の主観的な直感によらざるを得ない部
分が少なくない。(だからこそ、たとえばLIFULL HOME’S総研が2015年に提案し、都市が帯
びている情緒的、感覚的な価値の指標化=定量化を試みたSensuous City[官能都市]が話題を
呼び、注目を集めているのだろう)
 
こうした設計やプランニングに見られる状況の一方で、テキストの定量的な取り扱い自体は、
テキストマイニング分野の近年の飛躍によりかなり汎用性の高いものが出てきている。2013年
にGoogleがオープンソース化した自然言語処理ツールWord2Vecはこの最たるもので、単語の
もつ意味を文脈にもとづき推測し、多次元ベクトルとして表現できる。単語のベクトル化の説
明でよく使われる例だが、「王」ー「男」+「女」=「女王」というベクトル計算が可能にな
るのが、この「意味のベクトル化」の魅力的な部分だ。単語のもつ意味同士の近さをグラデー
ショナルに評価できる。(Googleでいくらでも興味深い関連記事が出てくるので関心のある
方はぜひ検索を)そして何より、これらの技術が誰でもアクセスできるオープンソースだとい
うことをあらためて強調しておきたい。
 
そして冒頭の状況とあらためて照らし合わせると、こうした汎用性の高い自然言語処理ツール
が普及した今だからこそ、テキストがもつ質的情報を量的情報に変換し、「意味」を寸法やそ
の他定量的指標と等価に扱えるパラメータとして設計操作に組み込んでいくことに、筆者は大
きな関心がある。それは設計の対象として捉えられる事物や生み出しうる価値の範囲を必ず拡
張していくはずだ。
 
つい先月に建築学会のオンラインウェブマガジン『建築討論』で、中村健太郎氏がEyal
Weizman著の”Forensic Architecture VIOLENCE AT THE THRESHOLD OF DETECTABILITY”
の書評を寄せていたことは記憶に新しく、上述のようなテキストデータと都市・建築の関係に
ついて考えていた筆者にとっては、Forensic Architectureの試みはまさに同時代的でとても興
味深く思えた。詳細は、中村氏の書評をご覧いただきたいが、Forensicとは科学捜査のことで、
彼らは国際裁判などに用いる証拠を、たとえば地域紛争における戦争犯罪といった反証がむず
かしい事件に対してつくる専門家集団だ。SNS上に流れてくる断片的な情報から現地測量まで、
ありとあらゆる情報から犯罪が行われた時間と空間をパッチワーク的に描き出し、それらを情
報空間内で時系列に沿って統合していく。彼らが取り扱う情報は、その目的の性格上、テキス
トであればあいまいさや主観を伴うものよりは、一意に定位できる解釈の多義性を排除したも
のになり、さらにいえば動画や映像を伴った複合的な情報として取り扱われることが多いよう
だ。従って、Forensic Architecture自体は必ずしも上述で指摘したところの感覚や情緒を取り
扱うテキストデータの可能性を直接的に示す事例ではないかもしれないが、一方で「人が見て
聞いた知覚の痕跡」をつなぎ合わせて情報空間を立ち上げるという手続きは、人が認知してい
る対象であるところの時空間をどう把握するかという問いに対しては、やはり非常に示唆的だ。Forensic Architectureが取り扱うような客観的な時空間にもう1レイヤー、ありとあらゆるテ
キスト情報に付与しうるベクトル空間を重ねていけば、客観的な空間のみならず、人々の多様
な主観までも紐づけられた重層的な空間を描き出すことが可能になるかもしれない。
 
いわゆる建築や都市の設計やプランニングでは、形式知化さえできていないものの、あいまい
さの中で主観的に立ち上がる日常空間の様を、建築や都市を経験する一人ひとりの目線まで下
りていき、想像力を働かせることで何とかつかもうとする。テキストデータはその作業に、よ
り冗長性や拡張性のある意味の奥行きを与える資源になるはずであり、計算を介してそのテキ
ストデータにアクセスすることは、その奥行きの細やかな機微をそのまますくいあげる道筋に
なりえる。あくまで備忘録の域をいまは出ないが、積極的に機会を見出し、少しずつ作業を積
み重ねていきたい魅力あるテーマだ。

 Google Open Source Blog 2013年8月14日掲載の” Learning the meaning behind words”
 より引用。
 Word2Vecによりベクトル化した各国の首都名と国名を示した意味ベクトルの差分を示すベク
 トルが主成分解析により2次元表示されたもの。首都名と国名の関係が概ねどの国でも一致し
 たベクトルで表現されていることがわかる。
 ※上記の画像、キャプションをクリックすると画像の出典元のGoogle Open Source Blogへ
 リンクします。

 Google Open Source Blog 2013年8月14日掲載の” Learning the meaning behind words”
 より引用。
 Word2Vecによりベクトル化した各国の首都名と国名を示した意味ベクトルの差分を示すベク
 トルが主成分解析により2次元表示されたもの。首都名と国名の関係が概ねどの国でも一致し
 たベクトルで表現されていることがわかる。
 ※上記の画像、キャプションをクリックすると画像の出典元のGoogle Open Source Blogへ
 リンクします。