Magazine(マガジン)

コラム

マスクを外すいま考えるAIとの付き合い方

2023.03.16

パラメトリック・ボイス                                   竹中工務店 / 東京大学 石澤 宰


Q:□に入るのは?
{1, 2, 3, 5, 8, 13,□}
 
この並びはフィボナッチ数列だから(それにしては最初の1が2個ないのが気になるが)21
でしょ!と答えさせたあとで、「残念!実は(x-1)(x-2)(x-3)(x-5)(x-8)(x-13)(x-□)=0
の解だからどんな数字でもOKでした!」というのを以前どこかで見た記憶がかすかにあり
ます。
 
そんなこと言い出したら何でもアリやんけ!なのですが、上記はただの底意地の悪い話
として出てくるのではなく、「規則性を見抜くというのは自明なようでいてそうではな
い」という主張のための例題であったと記憶しています。
 
実際、上記のようなパターンに対して「何だろうか、まったく想像もつかないや」とい
うのはそれはそれで問題でありつつ、「答えは25!理由はなんとなくです!」というの
も違う。一旦は21にたどり着いた上で、本当にそれしかないのか?という思考をたどり
たいところではある。最終的には、「この問題は一体どこまで聞こうとしているのか」
というメタ認知を発動させることになりそこまでやる人には少なからず「#屁理屈
いうハッシュタグが付けられる。世の中はそういうものです。
 
最近私はこの話を別な文脈から思い出しました。「2023年3月13日からマスク着用は
個人の判断」とする政府方針が発表されたときのことです。ちょっと長くなるのですが
お付き合いください。
 
オンラインでのみお会いしていた方と実際に対面したとき、石澤はよく「思ったより背
が高いんですね」と言われます。私の声なり顔立ちなりから推察したり、あるいはお知
り合いから類推したりした結果、「なんとなくこんなぐらいだろうと思っていたらそれ
よりデカかった」ないしは「平均よりデカいというイメージはなかった」というような
ことなのだと思います。
 
同類と思われる私の体験には、「見かけた背中が知り合いかと思って、追い抜いて振り
返ったら別人だった」というのがあります。背格好や服装、その駅にいそうであるとい
う何らかの情報でそう判断するのでしょうが、これがまああたらない。そもそも知人の
背中などほとんど知識としては入っていないはずで、しかも「当たったためしがないの
だから確認しても無意味だ」という学習もできるはずなのに、未だにそういう経験が
ボチボチとある。
 
ただ、これは私の推論アルゴリズムの出来が悪いためかというと、精度良くできるとき
もあって、それは自分の子供を探すときです。なにしろ子供のことはよく見ているので、
持っている服かどうかは大体わかるし、背格好や髪型が多少他の子と似ていても正答率
は他の人に比べたら格段に高い。写真が遠目の後ろ姿でもこれはさすがにわかります。
類題としては、私が子供の頃に家で飼っていた大型犬は、今街で同じ犬種を見かけても
顔の違いをなんとなく言語化できます。しかし同じことをフンボルトペンギンやコツメ
カワウソには多分できない。できる方もいると思います。
 
それで上記のマスクの話ですが、これまでも「マスクなしで初めて見る顔は想像と違う
ことが間間ある」という指摘はあり、多くの方にご経験があるのではないかと拝察しま
す。それも、「マスク顔の下に理想の形を想像しがちである」という意見もあり、その
ことから「マスクを外すことに抵抗がある」という意見も目にします。これらリンク先
の記事でなされている考察と、最近G検定の試験を受けて(結果待ち中です。けっこう
難しかった……)深層強化学習の教科書知識をどっぷりインプットした私が思ったこと
には少し違いがあります。
 
人間の脳にはマスキングされたりノイズが入ったりした情報を勝手に補完する性質があ
る、ということは知られています。例えば下記の画像には(特段何も言われずとも)緑
色の三角形が見えるはずですし、「こんちには おんげき ですか にほごんで あさいつ
しまていす」という未知の文字列も、おそらく一通りに解釈できるはずです。


ただ、冒頭の数列の例で言えば、緑の図形は3方向から齧られたピザのような形で合っ
ているかもしれないし、「怨撃ですか」という謎の単語の可能性だって否定はできませ
ん。これまでのパターンの学習がそうさせている、という結果にすぎないはずです。
 
一方で、私が自分の子供や飼い犬を少ない情報からかなり正確に見分けられるのは、
「何度も答え合わせをして強化学習をしているから」と解釈できるかもしれません。こ
の見分けは、緑の図形が本当はどんな形であるかより私にとっては重要なことなので、
何度もやっているうちに精度が上がっている。これは、推論をさらに鍛えるというプロ
セスを挟んでいるからです。
 
フィボナッチ数列や単純な三角形、よくある日本語のフレーズというのは、パターンに
はまっていて、「人間の脳にとっては処理がかんたんな」情報であるように思われます。
情報が欠けていると処理に難があるので、とりあえずそれっぽい情報を埋めておく、
というのはどうも人間の脳が普段からやっていることのようです。私達の視界には盲点
という、ものが見えない点があることは知られている(うえに、誰しも小学生の頃に確
かめたことがある)のに、普段そのことを意識しないのはこの作用あってのことのはず
です。
 
おそらく、マスクを外したときの顔や、後ろ姿から想像する人というのは、この「脳に
とってだいたいこんな感じだとスッと想像しやすい」情報なのでしょう。情報エントロ
ピーが低い、とも言えそうです。そしてこれまで、その推論精度を上げるということは
してこなかったので、フィボナッチ数列のように「流れ的に収まりの良い情報」にとど
まり、現実の人の顔というもの(の最頻値のようなもの)に合わせる機能は特に鍛えら
れていない。実は脳が答えを当てに行っていないから、予想がはずれて意外だと感じる。
それが、今後マスクを外した人とたくさん会うことになると、私たちはともすれば、そ
の推論が上手になるかもしれない。そういう変化がこの春に起きるかもしれません。い
え、人間誰しも、そこまで他人のことを気にかけて暮らしてはいないものですけれども。
 
ここ数ヶ月でますます進化しているように見えるChat GPTのようなサービスは、この
「いかにもありそうなパターン」を埋めてきます。私が書いた英語など、ちょっと投げ
てみるだけで「そうそう、そういう風に言いたかったのよ!」という文章になって返っ
てきます。ちょうど脳がおぼろげな視覚情報から何かを補って、もっともらしい情報を
作り上げることのアナロジーがぴったりきます。しかし脳も間違う、AIも間違う。まこ
としやかに間違ったことをChat GPTも言うし、人間の目だって(少なくとも石澤の目と
脳は)上記のとおりです。
 
そして、その「ありそうでないもの」とか「今までと違うもの」を作ることは、ものを
作る人には問われることです。《普通に考えればこうですよね、でもあえてこうするん
です》。そのために必要なことを、ある人は行動を起こすためのリーダーシップと言い、
またある人は職能を守るためのディフェンスと言いました。あえて違うことをしてみる。
(x-1)(x-2)(x-3)(x-5)(x-8)(x-13)(x-□)=0の解なんてバカバカしい、とは言わず、そう
かそれもあるよな、と言う。それがうまくできない時期は、ひょっとしたらAIのほうが
上手にできてしまうんじゃないかと悩んだとしても、やる。意外性のあるもの、普通と
違う考え方は、どうせシナリオに載っていないのです。機械でなく人ががんばって作っ
たのならその労働を応援したいそのプロセスとコミュニティを守ることが職能形成
のうえで欠かせなくなってきていると感じます。
 
今私がこれを書いているNotionというソフトも、キーワードを与えればAIが下書きを勝
手に書いてくれます。思ったよりずっと気の利いたことを書いてくれるのですごいと思
いつつ、そこから書き始めることはしません。だって、時々お寄せいただく「面白かっ
たです、笑ってしまいました」という反響を受け取ったときには、「でしょ?頑張って
書いた甲斐がありましたよ~」と思ってニンマリしたいものです。でも論文の英語の推
敲は別です。だって中身が勝負だから、英語は道具に頼ってもね……いいはずですよ、
ね……?早く自信を持ってそう言える研究者になりたいものです。

石澤 宰 氏

竹中工務店 設計本部 アドバンストデザイン部 コンピュテーショナルデザイングループ長 / 東京大学生産技術研究所 人間・社会系部門 特任准教授