考えることしかできない
人類が何千年もかけて「知性」と呼んできたものは、実のところ、知性のうちでもっとも薄い層だったのかもしれない。
1997年、IBMのDeep Blueがチェス世界王者ガルリ・カスパロフを破った日、世界は「機械が人間を超えた」と騒いだ。しかし同じ機械は、テーブルの上のコーヒーカップを持ち上げることができなかった。チェスの王を詰められる計算能力が、マグカップの取っ手を握る動作の前では無力だった。
1988年、ロボット工学者ハンス・モラヴェックは著書 Mind Children(Harvard University Press)のなかで、この奇妙な非対称性を一文に凝縮した。「知能テストやチェスで大人レベルの性能をコンピュータに発揮させることは比較的容易だが、知覚や運動に関して一歳児のスキルを与えることは困難、あるいは不可能だ」。同時期にロドニー・ブルックスやマービン・ミンスキーも同様の観察を述べている。これがモラヴェックのパラドックスと呼ばれるものだ。
そしてこのパラドックスが本当に突きつけているのは、AIの限界ではない。「知性とは何か」という問いに対する、人間の見積もりの甘さだ。
見えないものを簡単と呼ぶ
人間が「簡単だ」と感じるものと、計算上の困難さは、まったく別の尺度に属している。
歩く。物をつかむ。顔を見分ける。これらの動作を「簡単」と感じるのは、数億年の進化がその処理系を磨き上げ、意識の手前で完結するようにしたからにすぎない。モラヴェック自身は進化論的な説明を提示している。スキルが古いほど、自然選択が設計を最適化する時間は長かった。抽象的な推論はごく最近になって発達した能力であり、その実装が効率的であることを期待する理由はない、と。
人間の直感的な「難易度」は、意識的にアクセスできる処理の量で測られている。チェスは「考えている」実感があるから難しく見える。歩くことには「考えている」実感がないから簡単に見える。しかし脳が歩行のために行っている計算は、チェスの手を読む計算よりもはるかに膨大だ。
私たちは自分自身の計算の大部分を見ていない。見えないものを「簡単」と呼んでいるだけだ。
手が先に知っている
ヒューバート・ドレイファスは1972年の著書 What Computers Can't Do で、人工知能研究への根本的な批判を展開した。ドレイファスはハイデガーの「世界内存在(In-der-Welt-sein)」の概念を援用し、知性が身体と環境に不可分に埋め込まれていると論じた。
知性を記号操作として捉える伝統的なAI研究のアプローチは、知性の表層しか捉えていない。人間は世界を「表象」してから行動しているのではなく、世界の中にすでに投げ込まれた存在として、身体を通じて世界と関わっている。ドアノブを回すとき、あなたはドアノブの形状を分析し、回転角度を計算し、必要なトルクを算出してから手を伸ばしているわけではない。手が「知っている」のだ。
モラヴェックのパラドックスは、この哲学的主張をエンジニアリングの現場から裏書きした形になっている。身体化された認知(embodied cognition)は、1990年代以降、認知科学の主流のひとつとなった。知覚、言語、記憶、カテゴリー化、問題解決にいたるまで、認知のあらゆる領域が身体的な基盤を持つことが示されてきた。
しかし「示された」ことと「再現できた」ことは違う。理解することと作れることの間にある溝は、依然として深い。
記号の薄さ
ジョン・サールが1980年に提示した「中国語の部屋」は、記号操作だけでは理解に到達しないと主張した。部屋の中の人間は、中国語の規則に従って記号を操作し、外から見れば中国語を「理解している」ように見えるが、実際には何ひとつ理解していない。
モラヴェックのパラドックスは、この議論をさらに一段押し進めているとも読める。サールの論点は「記号操作は理解ではない」だった。モラヴェックのパラドックスが示唆するのは、記号操作が得意な領域こそ知性のもっとも浅い層にすぎない、ということだ。
チェスを指す。定理を証明する。文章を生成する。これらはすべて記号の操作として再現可能な領域に属している。しかし赤ん坊が生後数ヶ月で顔を認識し、一歳前後で歩行を習得する過程で脳が構築している処理は、記号化すらされていない。あなたには何も見えていないで書いたように、知覚という体験そのものが、私たちが思っているほど自明ではない。そして自明でないものを機械で再現することがなぜこれほど困難なのかという問いは、技術的な問題であると同時に、哲学的な問いでもある。
1969年、ジョン・マッカーシーとパトリック・ヘイズが定式化した「フレーム問題」も、同じ根を共有している。AIが行動を計画するとき、「変化しないもの」をどう処理するかという問題だ。爆弾を別の部屋に運ぶロボットは、爆弾の色も一緒に運ばれることを推論する必要があるか。壁の色は変わらないことを確認する必要があるか。人間は無意識に「関係ない情報」を無視する。AIにとっては、何が関係ないかを判断すること自体が計算的に爆発する。フレーム問題が「常識」の困難さを示すなら、モラヴェックのパラドックスは「身体」の困難さを示す。どちらも、人間が無意識にやっていることの膨大さという同じ場所に帰着する。
境界は後退し続ける
CAPTCHAの変遷は、この非対称性の小さな寓話かもしれない。初期のCAPTCHAは歪んだ文字の認識を求めた。当時のbotには困難で、人間には一瞬の作業だった。やがて文字認識が突破され、「信号機を選べ」、「横断歩道を選べ」というタスクに移行した。人間にとっては何でもない知覚判断が、機械にとっては最大の障壁だった。そしていま、その障壁も崩れつつある。
大規模言語モデルは言語という記号操作において人間を凌駕しつつあり、画像認識も急速に進歩している。マルチモーダルAI、具現化AI(Embodied AI)の研究は、モラヴェックのパラドックスの図式を更新しようとしている。
しかし自動運転の「最後の1パーセント問題」は残っている。高速道路の直線走行は早い段階で実現されたが、住宅街で子どもが飛び出してくる場面や、工事現場の作業員のジェスチャーの解釈には依然苦戦している。ボストン・ダイナミクスのロボットが階段を上る動画を見て「すごい」と思うのは、人間にとって当たり前の動作が、何十年もの研究と膨大な計算資源を要したことを直感的に感じ取っているからだろう。
モラヴェックのパラドックスは「解消されつつある」のだろうか。それとも「問題の深さが改めて確認されている」のだろうか。おそらく、両方なのかもしれない。技術は境界を押し広げ続けている。しかし押し広げるたびに、その向こう側にさらに広い未踏の領域が見えてくる。
掘った先に何がある
ここでもうひとつの問いが浮かぶ。知覚と運動を完璧に再現した機械は、「体験」を持つのだろうか。
灯りと不在で触れた哲学的ゾンビの思考実験が、ここに接続する。行動的に人間と区別がつかない存在が、内側では何も感じていないということは、論理的に可能なのか。モラヴェックのパラドックスは知覚の計算論的な側面を鮮やかに照らすが、現象的意識には触れない。触れることができない。
気づかないまま消える。もし意識が物質の種類に依存しないなら、シリコンで再現された知覚処理にも意識は宿るのかもしれない。しかし宿るかどうかを確かめる方法がない。チューリングテストが「理解」の有無を判定できないのと同じように、行動の観察からは内側の有無を覗けない。
知性の底を掘り続けたら、その先に意識があるのか、それとも意識の不在があるのか。どちらであっても、掘っている側にはわからない。
底を頂点と呼んだ
AIの文章に価値はあるか。AIが言語を操り、画像を生成し、コードを書くとき、それはモラヴェックのパラドックスが示す「知性のヒエラルキー」のどこに位置するのだろう。
皮肉なことに、AIがもっとも得意とする領域は、人間がもっとも「高度」だと信じてきた領域だ。論理的推論。パターン認識。言語生成。しかしモラヴェックのパラドックスに従えば、これらはすべて知性の表層にすぎない。AIがいまだ苦手とする領域、つまり身体を持って世界の中を動き回ること、文脈を身体ごと理解すること、「関係ないこと」を無意識に無視することのほうが、はるかに深い処理を要する。
ここに奇妙な転倒がある。人間は「考える」ことを知性の頂点に置いてきた。デカルトの「我思う、ゆえに我あり」は、思考を存在の証拠にまで格上げした。しかしモラヴェックのパラドックスは、その「思う」という行為が知性のうちでもっとも安価な部品だったかもしれないと示唆する。
赤を知らないし、何もわからない。知識ですべてに到達できると思っていた場所の外側に、知識では永遠にたどり着けない何かが広がっている。知性の頂点だと思っていたものは、実は底だったのかもしれない。そしてその底の上に、意識にも登れないほど巨大な暗黙の処理が積み重なっている。
知性の本体は、考えることではなかったのかもしれない。
数億年かけて磨き上げられた知覚と運動の膨大な暗黙の処理を、人間は「当たり前」と呼び、つい最近になって発達した記号操作の薄い層を「知性」と名づけた。名前をつけた瞬間に、見えなくなったものがある。
機械は考えることを覚えた。歩くことはまだうまくいかない。そしてその事実が意味しているのは、考えることが知性の頂点ではなく、底だったということだ。
底を誇りに思って生きてきた。それが、人間だった。