哲学を読む

考えることしかできない

Sakashita Yasunobu

28 2月 2026 — 7 min read

人類が何千年もかけて「知性」と呼んできたものは、実のところ、知性のうちでもっとも薄い層だったのかもしれない。

1997年、IBMのDeep Blueがチェス世界王者ガルリ・カスパロフを破った日、世界は「機械が人間を超えた」と騒いだ。しかし同じ機械は、テーブルの上のコーヒーカップを持ち上げることができなかった。チェスの王を詰められる計算能力が、マグカップの取っ手を握る動作の前では無力だった。

1988年、ロボット工学者ハンス・モラヴェックは著書 Mind Children（Harvard University Press）のなかで、この奇妙な非対称性を一文に凝縮した。「知能テストやチェスで大人レベルの性能をコンピュータに発揮させることは比較的容易だが、知覚や運動に関して一歳児のスキルを与えることは困難、あるいは不可能だ」。同時期にロドニー・ブルックスやマービン・ミンスキーも同様の観察を述べている。これがモラヴェックのパラドックスと呼ばれるものだ。

そしてこのパラドックスが本当に突きつけているのは、AIの限界ではない。「知性とは何か」という問いに対する、人間の見積もりの甘さだ。

見えないものを簡単と呼ぶ

人間が「簡単だ」と感じるものと、計算上の困難さは、まったく別の尺度に属している。

歩く。物をつかむ。顔を見分ける。これらの動作を「簡単」と感じるのは、数億年の進化がその処理系を磨き上げ、意識の手前で完結するようにしたからにすぎない。モラヴェック自身は進化論的な説明を提示している。スキルが古いほど、自然選択が設計を最適化する時間は長かった。抽象的な推論はごく最近になって発達した能力であり、その実装が効率的であることを期待する理由はない、と。

人間の直感的な「難易度」は、意識的にアクセスできる処理の量で測られている。チェスは「考えている」実感があるから難しく見える。歩くことには「考えている」実感がないから簡単に見える。しかし脳が歩行のために行っている計算は、チェスの手を読む計算よりもはるかに膨大だ。

私たちは自分自身の計算の大部分を見ていない。見えないものを「簡単」と呼んでいるだけだ。

手が先に知っている

ヒューバート・ドレイファスは1972年の著書 What Computers Can't Do で、人工知能研究への根本的な批判を展開した。ドレイファスはハイデガーの「世界内存在（In-der-Welt-sein）」の概念を援用し、知性が身体と環境に不可分に埋め込まれていると論じた。

知性を記号操作として捉える伝統的なAI研究のアプローチは、知性の表層しか捉えていない。人間は世界を「表象」してから行動しているのではなく、世界の中にすでに投げ込まれた存在として、身体を通じて世界と関わっている。ドアノブを回すとき、あなたはドアノブの形状を分析し、回転角度を計算し、必要なトルクを算出してから手を伸ばしているわけではない。手が「知っている」のだ。

モラヴェックのパラドックスは、この哲学的主張をエンジニアリングの現場から裏書きした形になっている。身体化された認知（embodied cognition）は、1990年代以降、認知科学の主流のひとつとなった。知覚、言語、記憶、カテゴリー化、問題解決にいたるまで、認知のあらゆる領域が身体的な基盤を持つことが示されてきた。

しかし「示された」ことと「再現できた」ことは違う。理解することと作れることの間にある溝は、依然として深い。

記号の薄さ

ジョン・サールが1980年に提示した「中国語の部屋」は、記号操作だけでは理解に到達しないと主張した。部屋の中の人間は、中国語の規則に従って記号を操作し、外から見れば中国語を「理解している」ように見えるが、実際には何ひとつ理解していない。

モラヴェックのパラドックスは、この議論をさらに一段押し進めているとも読める。サールの論点は「記号操作は理解ではない」だった。モラヴェックのパラドックスが示唆するのは、記号操作が得意な領域こそ知性のもっとも浅い層にすぎない、ということだ。

チェスを指す。定理を証明する。文章を生成する。これらはすべて記号の操作として再現可能な領域に属している。しかし赤ん坊が生後数ヶ月で顔を認識し、一歳前後で歩行を習得する過程で脳が構築している処理は、記号化すらされていない。あなたには何も見えていないで書いたように、知覚という体験そのものが、私たちが思っているほど自明ではない。そして自明でないものを機械で再現することがなぜこれほど困難なのかという問いは、技術的な問題であると同時に、哲学的な問いでもある。

1969年、ジョン・マッカーシーとパトリック・ヘイズが定式化した「フレーム問題」も、同じ根を共有している。AIが行動を計画するとき、「変化しないもの」をどう処理するかという問題だ。爆弾を別の部屋に運ぶロボットは、爆弾の色も一緒に運ばれることを推論する必要があるか。壁の色は変わらないことを確認する必要があるか。人間は無意識に「関係ない情報」を無視する。AIにとっては、何が関係ないかを判断すること自体が計算的に爆発する。フレーム問題が「常識」の困難さを示すなら、モラヴェックのパラドックスは「身体」の困難さを示す。どちらも、人間が無意識にやっていることの膨大さという同じ場所に帰着する。

境界は後退し続ける

CAPTCHAの変遷は、この非対称性の小さな寓話かもしれない。初期のCAPTCHAは歪んだ文字の認識を求めた。当時のbotには困難で、人間には一瞬の作業だった。やがて文字認識が突破され、「信号機を選べ」、「横断歩道を選べ」というタスクに移行した。人間にとっては何でもない知覚判断が、機械にとっては最大の障壁だった。そしていま、その障壁も崩れつつある。

大規模言語モデルは言語という記号操作において人間を凌駕しつつあり、画像認識も急速に進歩している。マルチモーダルAI、具現化AI（Embodied AI）の研究は、モラヴェックのパラドックスの図式を更新しようとしている。

しかし自動運転の「最後の1パーセント問題」は残っている。高速道路の直線走行は早い段階で実現されたが、住宅街で子どもが飛び出してくる場面や、工事現場の作業員のジェスチャーの解釈には依然苦戦している。ボストン・ダイナミクスのロボットが階段を上る動画を見て「すごい」と思うのは、人間にとって当たり前の動作が、何十年もの研究と膨大な計算資源を要したことを直感的に感じ取っているからだろう。

モラヴェックのパラドックスは「解消されつつある」のだろうか。それとも「問題の深さが改めて確認されている」のだろうか。おそらく、両方なのかもしれない。技術は境界を押し広げ続けている。しかし押し広げるたびに、その向こう側にさらに広い未踏の領域が見えてくる。

掘った先に何がある

ここでもうひとつの問いが浮かぶ。知覚と運動を完璧に再現した機械は、「体験」を持つのだろうか。

灯りと不在で触れた哲学的ゾンビの思考実験が、ここに接続する。行動的に人間と区別がつかない存在が、内側では何も感じていないということは、論理的に可能なのか。モラヴェックのパラドックスは知覚の計算論的な側面を鮮やかに照らすが、現象的意識には触れない。触れることができない。

気づかないまま消える。もし意識が物質の種類に依存しないなら、シリコンで再現された知覚処理にも意識は宿るのかもしれない。しかし宿るかどうかを確かめる方法がない。チューリングテストが「理解」の有無を判定できないのと同じように、行動の観察からは内側の有無を覗けない。

知性の底を掘り続けたら、その先に意識があるのか、それとも意識の不在があるのか。どちらであっても、掘っている側にはわからない。

底を頂点と呼んだ

AIの文章に価値はあるか。AIが言語を操り、画像を生成し、コードを書くとき、それはモラヴェックのパラドックスが示す「知性のヒエラルキー」のどこに位置するのだろう。

皮肉なことに、AIがもっとも得意とする領域は、人間がもっとも「高度」だと信じてきた領域だ。論理的推論。パターン認識。言語生成。しかしモラヴェックのパラドックスに従えば、これらはすべて知性の表層にすぎない。AIがいまだ苦手とする領域、つまり身体を持って世界の中を動き回ること、文脈を身体ごと理解すること、「関係ないこと」を無意識に無視することのほうが、はるかに深い処理を要する。

ここに奇妙な転倒がある。人間は「考える」ことを知性の頂点に置いてきた。デカルトの「我思う、ゆえに我あり」は、思考を存在の証拠にまで格上げした。しかしモラヴェックのパラドックスは、その「思う」という行為が知性のうちでもっとも安価な部品だったかもしれないと示唆する。

赤を知らないし、何もわからない。知識ですべてに到達できると思っていた場所の外側に、知識では永遠にたどり着けない何かが広がっている。知性の頂点だと思っていたものは、実は底だったのかもしれない。そしてその底の上に、意識にも登れないほど巨大な暗黙の処理が積み重なっている。

知性の本体は、考えることではなかったのかもしれない。

数億年かけて磨き上げられた知覚と運動の膨大な暗黙の処理を、人間は「当たり前」と呼び、つい最近になって発達した記号操作の薄い層を「知性」と名づけた。名前をつけた瞬間に、見えなくなったものがある。

機械は考えることを覚えた。歩くことはまだうまくいかない。そしてその事実が意味しているのは、考えることが知性の頂点ではなく、底だったということだ。

底を誇りに思って生きてきた。それが、人間だった。

怪物の口に幸福が吸い込まれる

幸福の総量を最大化する。それが正しいと言われてきた。しかし1974年、ロバート・ノージックはたった一つの問いでその前提を破壊した。もしある存在が、他の全員よりも圧倒的に多くの快楽を得られるなら、功利主義は全員の取り分をその「怪物」に差し出すことを要求する。あなたの幸福は計算の端数だった。切り捨てられた。幸福を貪る口 1974年、ロバート・ノージックは『アナーキー・国家・ユートピア』のなかで一つの思考実験を置いた。功利主義は、効用の怪物の可能性によって困惑させられる。怪物は、他の人々の犠牲から、その人々が失う以上に圧倒的に大きな効用の増加を得る。仕組みは単純だ。功利主義の原則に従えば、社会全体の幸福を最大化する資源配分が「正しい」。ここに一人、あらゆる資源からとてつもない快楽を引き出す存在が現れたとする。りんご一個で他の百人分の快楽を得る。映画を一本見れば千人分の歓喜を感じる。功利主義はこの怪物にすべてを差し出すことを要求する。他の全員が飢えても、怪物の快楽が総量を上回る限り、それが「最善」だと計算は告げる。ノージックが示したかったのは、功利主義が論理的に正し

綱を引く手が一本ずつ消えていく

あなたは集団のなかで、少しずつ消えている。それは比喩ではない。測定可能な事実だ。19世紀末、フランスの農学者マクシミリアン・リンゲルマンは、人が集団で綱を引くとき、一人あたりの力が確実に減少することを発見した。人数が増えるほど、個人は薄まる。誰のせいでもなく、誰も怠けているわけではなく、ただ構造がそうさせる。もしあなたがいま、何かのチームに属しているなら、あなたはすでに全力を出していない。そしてそのことに、おそらく気づいてもいない。綱を引く手が教えたことリンゲルマンの実験は素朴だった。 1880年代から1900年代初頭にかけて、彼は農業機械の効率を研究する過程で、人間が集団で水平方向に荷を押したり引いたりする際のパフォーマンスを測定した。その結果は1913年に報告されている。一人で綱を引くとき、その人間は持てる力をすべて発揮する。二人になると、一人あたりの出力は約93%に落ちる。三人で85%。八人になると、49%。半分以下だ。この数字の意味を考えてみてほしい。八人で綱を引いているとき、あなたは一人のときの半分も力を出していない。しかもそのことに自覚がない。全員が

嘘が真実を食い尽くす朝

「この文は嘘である」この一文を前にして、あなたは立ち往生する。もし真だとすれば、文の内容に従って偽になる。もし偽だとすれば、「嘘である」という主張が間違っていることになり、真になる。真だと仮定しても偽だと仮定しても、反対の結論にたどり着く。出口がない。これは言葉遊びではない。2300年以上にわたってこの問いに取り組んできた哲学者と論理学者たちは、いまだに合意に至っていない。解決策はいくつも提案されてきた。どれも、別の問題を抱えている。あなたが自分自身について何かを語ろうとするとき、同じ構造がそこにある。循環の入口試しにやってみてほしい。「この文は嘘である」が真か偽か、判定する。真だと仮定する。この文は「嘘である」と主張しているのだから、偽になる。仮定と矛盾する。では偽だと仮定する。「嘘である」という主張が偽ということは、嘘ではない。つまり真になる。やはり仮定と矛盾する。どちらに転んでも矛盾する。そしてこの矛盾は、推論のどこかでミスを犯したから生じたのではない。前提そのものに埋め込まれている。エピメニデスの不発弾よく混同されるが、古代ギリシアの

何でも飾れる額縁だけが残った

1917年、マルセル・デュシャンは既製品の男性用小便器に「R. Mutt」と署名し、「泉（Fountain）」と名づけてニューヨーク独立芸術家協会の展覧会に出品した。拒否された。それだけの話だ。だが「それだけ」のはずの出来事が、それ以降のすべての芸術を汚染した。美しさも技巧も素材の選択も関係ない。署名ひとつ、提示の身振りひとつで、便器が「芸術」を名乗れる。そしてその瞬間から、「芸術とは何か」という問いは回答不能になった。回答不能のまま、100年以上が過ぎている。目で見えないものが芸術を決める 1964年、アンディ・ウォーホルはスーパーマーケットに並ぶブリロの箱と見た目がまったく同じ「ブリロ・ボックス」をギャラリーに置いた。哲学者アーサー・ダントーは、この事態に根本的な問いを見出した。視覚的に区別できない二つの対象のうち、片方だけが芸術である。では芸術を芸術にしているのは何なのか。ダントーの答えは「アートワールド」だった。芸術作品を芸術たらしめるのは知覚可能な性質ではなく、理論と批評と歴史が編み上げた解釈の共同体、その「理論的雰囲気」なのだと。あなたには何も見えていない。文字