誰も学びを測れない
あなたの学びは数字ひとつで語れるらしい。3.2。あるいは2.7。あるいは3.8。この小数点以下のわずかな差に、何千時間もの思考と迷いと夜更かしと発見が圧縮されている。いや、圧縮されたのではない。消えたのだ。
GPAという仕組みは、ひとりの人間が大学で過ごした数年間を、小数点第二位までの数字に変換する。その数字を見て、企業は採用を判断し、大学院は合否を決め、奨学金の選考委員はファイルを閉じる。数字は便利だ。便利すぎて、数字の向こうに何があったかを誰も問わなくなる。
この文章は、その数字の向こう側を覗こうとする試みだ。覗いた先に何があるかは保証しない。たぶん、何もない。
数字が知性を騙る
イギリスの経済学者チャールズ・グッドハートは1975年の講演でひとつの法則を示した。本来は金融政策における統計的規則性についての指摘だったが、後にこう要約されるようになる。
ある指標が目標になると、それは良い指標ではなくなる。 "When a measure becomes a target, it ceases to be a good measure."
GPAに当てはめてみると、破壊力がわかる。
GPAはもともと、学生の学業をある程度把握するための参考指標だったはずだ。しかしそれが就職活動や大学院入試の選抜基準として機能し始めた瞬間、性質が変わる。学生は学びを深めるためではなく、数字を上げるために動き始める。挑戦的な科目を避ける。単位の取りやすい授業を選ぶ。暗記で試験を乗り切る。指標が目標に変わると、その指標が本来測ろうとしていたもの自体が歪む。測ろうとした瞬間に、測りたかったものが壊れる。
社会心理学者ドナルド・T・キャンベルも、グッドハートとは独立に、ほぼ同じ構造を定式化している。
ある量的な社会指標が社会的意思決定に使われるほど、その指標は腐敗の圧力にさらされ、それが監視しようとしていた社会的プロセスそのものを歪め、腐敗させる傾向が強まる。
教育における「テストのための教育(teaching to the test)」は、この法則が教室で静かに作動し続けている証拠だ。テストで高得点を取ることが目的になれば、テストで測定できない種類の能力の涵養は自然と優先度を下げられる。測定できるものだけが「成果」として扱われ、測定できないものは、なかったことにされる。(この構造は入試にそのまま現れている。合格点付近でわずかな点差が人生を分岐させる選抜の問題については「大学入試と選抜」で考えた。)
ここで立ち止まって考えてみる。テストで測れるのは「テストで測れるもの」だけだ。これはほとんど同語反復であり、あまりに当たり前のことだ。しかしこの当たり前のことが、なぜ教育制度の設計にいまだ反映されないのだろう。おそらく、反映してしまうと制度そのものが回らなくなるからだ。この問いには、後で戻ってくる。
資格という亡霊
1971年、イヴァン・イリイチは『脱学校の社会(Deschooling Society)』を著した。イリイチの批判の核心は明快だ。学校という制度は、「学ぶこと」と「学校に通うこと」を同一視させた。そして制度の内部で発行された資格だけが正当な知識の証明として社会的に通用するようになった。
学校は知識を提供する場であると同時に、知識へのアクセスを制限するゲートキーパーでもある。独学で微積分を完璧に理解した人間と、大学の単位として微積分のAを取った人間がいるとする。社会がどちらを「知っている人」として扱うかは、考えるまでもない。知識そのものではなく、知識を認定する制度のほうが力を持っている。(教育が本来何のためにあるのかという問いに立ち返れば、自由と統制のあいだで揺れ続ける制度の姿が浮かぶ。「教育の目的と自由」で、この緊張について書いた。)
この直感を経済学の言葉で裏付けたのが、マイケル・スペンスの仕事だ。スペンスは1973年の論文で、労働市場におけるシグナリングのモデルを示した。このモデルが突きつけるのは、学歴が能力を「証明」しているのではなく能力の「シグナル」として機能しているという構造だ。教育が実際にスキルを向上させるかどうかは、このモデルでは本質的な問題にならない。学位を取得するという行為そのものが、雇用者に対して「この人物はある程度の忍耐力と遂行能力を持っている」というシグナルを送る。学びの中身ではなく、制度を最後まで走りきったという事実が市場価値を持つ。
もし学位がシグナルにすぎないのだとしたら、大学の4年間は何だったのだろう。この問いはあまりに不穏で、多くの人は正面から向き合いたがらない。しかし向き合わないからといって、問いのほうが消えてくれるわけではない。
もうひとつ、不穏な帰結がある。もし全人口の大半が大学を卒業するようになれば、学位のシグナルとしての弁別力はゼロに近づく。そしてこの状況は、多くの国で緩やかに現実化しつつある。シグナルが弱まれば、次のシグナルが求められる。大学院、資格試験、インターンシップの経歴。シグナルの軍拡競争に終わりは見えない。
知識の預金口座
パウロ・フレイレは『被抑圧者の教育学(Pedagogia do Oprimido)』の中で、伝統的な教育のあり方を「銀行型教育(banking model of education)」と名づけた。1960年代後半にポルトガル語で書かれ、1970年に英語版が出版されたこの著作は、教育を語る際の重要な参照点であり続けている。教師が知識を「預金」し、学生がそれを受動的に受け取る「口座」として機能する。
フレイレがこの比喩で批判したのは、単に教え方のスタイルではない。この構造そのものが、学生から批判的思考を奪い、既存の社会構造を疑問なく受け入れる人間を再生産する装置として機能するという、もっと根深い問題だ。知識は教師から学生へ一方向に流れ、学生は受容者として固定される。自分自身の経験や思考から出発して世界を理解する力は、この構造の中では育ちにくい。
フレイレが対案として掲げたのは「問題提起型教育(problem-posing education)」だった。教師と学生が対話を通じて共に問い、共に考え、共に世界を読み解く。教師もまた学ぶ存在であり、学生もまた教える存在である。フレイレは、この対話的な関係の中にこそ批判的な思考と主体性が生まれると考えた。
ここでGPAの話に戻ると、ある対応関係が見えてくる。GPAという評価制度は、銀行型教育と驚くほど相性がいい。なぜなら、GPAは預金の残高を数えているだけだからだ。教師が預けた知識を学生がどれだけ正確に再現できるかを測定し、数値にする。問題提起型教育の成果、たとえば「以前は気づかなかった視点に気づくようになった」とか「問いの立て方そのものが変わった」といった変化は、GPAの計算式に入りようがない。
知識を「持っている」か「持っていない」かで測定すること自体が、知識をモノとして扱う発想の延長線上にある。(そもそも「知っている」とはどういう状態なのかを問い始めれば、知識の定義そのものが六十年以上前に壊れたまま放置されていることに突き当たる。)しかし理解は本来、所有できるようなものだろうか。理解とは状態であり、プロセスであり、絶えず流動するものだ。昨日わかっていたことが今日わからなくなる。今日わからなかったことが明日ふと腑に落ちる。そういう種類のものに値札をつけようとする行為は、ある種の暴力ではないか。
測れないものたち
GPAに限らず、数値化が捉え損ねるものの一覧を試みに並べてみたい。完全なリストにはなりようがないが、それ自体がこのリストの存在意義を物語っている。
まず、理解の深さ。同じ概念を「知っている」と言う二人の人間がいるとして、その理解の質がまったく異なることは珍しくない。一方は教科書の定義を暗唱できるだけかもしれない。もう一方はその概念が生まれた歴史的背景まで含めて、概念の輪郭と限界を把握しているかもしれない。しかし外部から見て、この差を客観的に測定する確立された手法は存在しない。
次に、問いを立てる力。テストは正解を出す能力を測る装置だ。しかし、学問にとって、あるいは人生にとって、良い答えを出すことよりも良い問いを立てることのほうがしばしば重要ではないだろうか。にもかかわらず、問いの質を標準的に測定する方法は知られていない。
暗黙知。ハンガリー出身の物理化学者にして哲学者マイケル・ポランニーは、1966年の著作『暗黙知の次元(The Tacit Dimension)』で、「私たちは語れる以上のことを知っている("we can know more than we can tell")」と書いた。自転車の乗り方を知っているが、その知識を完全に言語化することはできない。経験を積んだ料理人は火加減を「わかっている」が、それを数式にすることはできない。学びの相当な部分はこの種の暗黙知として蓄積されており、試験用紙の上には決して姿を現さない。(語りえないものを語ろうとする困難そのものについては「哲学は文学的表現を必要とするか」で論じた。)
失敗から学んだもの。失敗したという事実は記録に残る。不合格、低い得点、やり直し。しかしその失敗を通じて何がどう変わったか、何を理解し直したか、どんな問いが新たに生まれたかは、どこにも記録されない。教育において最も重要な学びは、しばしば失敗のさなかにある。しかしその学びは、成功の数字の裏側に隠れたまま日の目を見ない。(もっとも、失敗が本当に何かを「教えた」のか、それともあとから物語を仕立てただけなのかは、また別の問題だ。)
知的誠実さ。わからないことを「わからない」と言える態度は、学問を支える根本的な美徳のひとつだ。しかし試験は、わからないことを「わかっているように見せる」技術に報酬を与える構造になっている。部分点を稼ぐために、理解していない内容をそれらしく書き並べた経験のある人は少なくないだろう。その技術に秀でた人が「成績の良い人」であるとすれば、成績とは結局のところ何を測っているのだろう。
文脈。同じ3.0でも、フルタイムで働きながら取った3.0と、他に何もせずに取った3.0は意味が違う。体調を崩した学期があったかもしれない。専攻外の、自分には明らかに難しい科目にあえて挑んだかもしれない。そうした背景は、数字のどこにも現れない。
「質」の幽霊
ロバート・M・パーシグは1974年の小説『禅とオートバイ修理技術(Zen and the Art of Motorcycle Maintenance)』の中で、大学の修辞学教師だった主人公が「クオリティ(Quality)」という概念に取り憑かれていく物語を描いた。パーシグのこの議論で核心的なのは、ひとつの経験だ。良い文章と悪い文章の違いは、読めばわかる。学生たちもわかる。しかしその違いを定義しようとすると、定義は必ず何かを取りこぼす。クオリティを言葉で捉えようとした瞬間に、それは手からすり抜ける。定義された「クオリティ」は、もはやクオリティそのものではなく、クオリティの影にすぎない。
この問いは「学びの質」の話とそのまま重なる。
学びの質とは何かを定義し、その定義に基づいて数値化し、比較可能にしようとした瞬間、それは「質」ではなく「指標」になる。指標になった瞬間にグッドハートの法則が起動する。質は指標に置き換えられ、指標は目標に変わり、目標になった指標はもはや質を映さない。
この構造をよく見ると、ある種の不可能性に突き当たる。学びの質を正確に測りたい。しかし測るためには質を定義しなければならない。定義した瞬間に質は失われる。つまり、学びの質を「正確に測る」ことは、原理的に不可能なのではないか。
もし「良い学び」を完全に定義できるなら、それを効率的に量産できるはずだ。カリキュラムを最適化し、教授法を標準化し、すべての学生に等しく「良い学び」を届ける。しかし、それができないことを、教育に携わるすべての人間が、言葉にはできないまでも直感的に知っている。教育とは、定義不可能なものに全面的に依存しながら運営されている制度なのかもしれない。(定義できないものを追い求めて走り続ける構造は幸福の追求にも通じている。定義のないゴールに向かって走る競技を、ふつうは徒労と呼ぶ。)
別の地獄
GPAの代わりになるものを探してみよう。
ポートフォリオ型評価。成果物を蓄積し、学びのプロセスと結果を目に見える形で残す方法。レポート、プロジェクトの記録、作品群を通じて、何を考えどう試行錯誤したかが残る。数字では見えない思考の深さが可視化される。しかし、ポートフォリオの「良さ」を判断する基準は、誰がどうやって決めるのだろう。その基準もまた、ひとつの指標ではないのか。
ルーブリック評価。達成水準を事前に明示し、段階的に評価する仕組み。採点者の主観を減らし、思考の深さや論証の質にも対応できる。しかしルーブリックは結局のところ、質を複数の項目に分解して各項目を数値化しているにすぎない。質を分解した瞬間に、質の全体性は失われないだろうか。
ピアレビュー。学生同士が互いの成果物を評価する。他者の仕事を評価する力自体が学びになる、という効果もある。しかしピアレビューが人気投票に堕す危険は常にある。評価する側の能力が未熟であれば、評価そのものが学びを歪める可能性もある。
自己評価とリフレクション。「何がわかって、何がまだわからないか」を学習者自身が振り返る仕組み。メタ認知を育てる効果は認められている。しかし、自分の学びを正確に評価できる人間がどれだけいるだろう。自己認識そのものが学びの成果であるとすれば、これは循環論法に陥る。学びが十分でない人間ほど、自分の学びの不十分さに気づけない。
これらの代替案はどれも、GPAが抱える問題の一部を解消する可能性を持っている。しかし同時に、それぞれが新しい問題を持ち込む。そして何より、どれも手間がかかる。何千人もの応募者を一律に並べたい企業の人事部にとって、ポートフォリオをひとつずつ読む余裕はない。GPAの最大の強みは「安い、速い、スケールする」という、教育的にはまったく美徳でない性質にある。
代替案を求めて走り回った先に待っているのは、結局のところ、別の種類の地獄だ。
GPAは死なない
ここまで読んで、「じゃあGPAを廃止すればいい」と思うかもしれない。残念ながら話はそう単純ではない。
GPAが存続している理由は、教育的に優れているからではない。行政的に便利だからだ。(大学経営がデータに基づく意思決定へと舵を切るなかで、数値化の圧力はむしろ強まっている。「IRと大学経営」で書いたように、データ活用の重要性が増す一方で、行き過ぎた効率化への警鐘も鳴らされている。)何千人、何万人の学生を比較可能な形で並べ替えることが求められる場面では、どんなに粗くても数値が一本あれば事足りる。代替案のコストが現行制度のコストを上回るかぎり、現行制度は「仕方なく」使い続けられる。
この構造はGPAに固有のものではない。不完全だとわかっている制度が、代替の手間が大きすぎるという理由で存続し続ける例は、社会のいたるところにある。制度の内部にいる人間に、その制度を根本から変えるインセンティブはほとんどない。変えることのリスクは具体的だが、変えないことのコストは目に見えにくい。
指標が不完全であることを全員が知っている。知っていながら、その指標に従い続けている。これは知識の問題ではない。構造の問題だ。全員が問題を認識していても誰も動けないとき、そこにあるのは無知よりもずっと深い種類の絶望だ。
すべてが数値になる世界で
少しGPAから離れて、視野を広げてみる。人間の営みを数値で捉えようとする衝動は、教育に限った現象ではない。
IQは知能を測定しているのか。それとも「IQテストを解く能力」を測定しているのか。知能の定義について学術的な合意が存在しないにもかかわらず、知能の数値化だけは先に進んでいる。
健康診断の数値。「異常なし」は「健康」と同じ意味だろうか。すべての検査値が正常範囲に収まっていれば、本当にその人は健康なのか。
企業のKPI。売上が上がっても、顧客が幸せになったとは限らない。業績指標が事業の本質を反映している保証はどこにもない。
SNSのフォロワー数。影響力の代理指標であるはずの数字が、影響力そのものの質を歪める。フォロワー数を増やすことが目的化し、発信の中身は二の次になる。ここでもグッドハートの法則が静かに動いている。
学術論文の被引用数。学術的価値の代理指標が、研究の方向性を歪めるとき。引用されやすいテーマが「重要なテーマ」にすり替わり、地味だが本質的な研究は見向きもされなくなる。
これらすべてに共通する構造がある。複雑な現象を単一の数値に圧縮すると、圧縮の過程で最も重要な情報が失われる。そして人間は、失われた情報の存在を忘れ、残った数値だけを見て判断するようになる。
アルフレッド・コジブスキーは1933年の著作『科学と正気(Science and Sanity)』の中でこう述べた。「地図は領土ではない("The map is not the territory.")」。GPAは学びの地図だ。IQは知能の地図だ。KPIは事業の地図だ。地図はある程度の有用性を持つ。しかし地図を領土そのものだと信じた瞬間に、人は道を見失う。
そして、地図なしで歩ける人間は、ほとんどいない。
それでも数える
ここまで来て、何かが解決しただろうか。何も解決していない。
学びの質を測る完璧な方法は、おそらく存在しない。GPAは粗雑で、ポートフォリオは手間がかかり、ルーブリックは質を項目に分解し、ピアレビューは偏り、自己評価は循環する。どの方法を選んでも、測れないものは測れないままだ。
しかし、測れないという事実は、測ろうとする行為を止めない。人間は数えることをやめられない。数えなければ比較できず、比較できなければ選べず、選べなければ制度が回らないからだ。制度が回らなければ、何千人もの見知らぬ人間のあいだで資源を配分する方法がなくなる。
GPAの問題は、GPAそのものの問題ではない。人間が大量の他者と共存するとき、他者を何らかの形で「要約」しなければならないという、社会そのものの構造的制約の問題だ。学びを数字に圧縮するのは、人間を数字に圧縮する行為の一部であり、社会を成り立たせるために必要とされる、暴力的な抽象化の一形態だ。
紀元前399年、ソクラテスはアテナイの法廷で不敬神と若者を堕落させた罪に問われ、死刑判決を受けて毒杯を仰いだ。罪状はそうだったが、彼が人々の敵意を買った本当の理由は、街角で問いを投げかけ続けたことにあった。彼は答えを出す代わりに問いを返し、相手の確信を揺さぶり続けた。現代の大学に入学したとして、成績は良かっただろうか。答えを書く欄に問いを返す学生を、現行の評価制度はどう処理するのだろう。
測れないものを測ろうとし続ける人間の営みは、滑稽であると同時に、どこか切実でもある。意味を求めること自体が病であるなら、学びの意味を数字に求めることもまた、同じ病の一症状なのかもしれない。自分の学びが何であるかを知りたい。知りたいから数える。しかし数えた瞬間に、学びは数字に変わり、数字はもう学びではない。
最後にひとつだけ聞きたい。あなたが最後に「ああ、わかった」と心の底から感じたのは、いつだったか。そのとき、何が起きていたか。それは試験の前夜だったか、それとも、試験とはまったく関係のない、ある静かな瞬間だったか。
その瞬間の価値を、小数点以下二桁で教えてほしい。