デジタルの紙を超えて

紙の資料がPDFになった。たったそれだけのことが、実際にはどれほど革命的だったか。そしてなぜ、それだけでは足りないのか。

紙からPDFへ

少し前まで、「資料」といえば紙のことだった。コピー機を通すたびに劣化する文字。数世代のコピーを経て原形をとどめないページ。手書きの注釈が入り混じった印刷物。回覧のために物理的に持ち運ばなければならない書類の束。それが「資料を配布する」ということの実態だった。

コロナ禍を契機にオンライン化が一気に進み、紙の資料は急速にPDFへと置き換わった。コミュニケーションツールが普及し、ファイル共有が当たり前になった。

この変化の大きさを、過小評価すべきではないと心から思う。

ニール・アームストロング船長の有名な言葉が頭に浮かぶ。

That's one small step for a man, one giant leap for mankind.
一人の人間にとっては小さな一歩だが、人類にとっては偉大な飛躍である。

紙からPDFへ。ファイルを送るだけで同じ文書が相手の画面に表示される。文字を検索できる。拡大しても潰れない。地球の裏側にいる人にも一瞬で届けられる。紙の時代には夢物語だった。これは確実に「偉大な飛躍」だった。

しかしPDFは「デジタルの紙」である

ここで立ち止まって考えたい。PDFとは結局のところ何なのか。

PDF(Portable Document Format)は1993年にAdobe Systemsが開発し、2008年にISO 32000として国際標準化された文書フォーマットだ。設計思想は明確で、「どの環境で開いても同じ見た目で表示されること」を保証する。フォント、余白、行間、図の配置。すべてが固定され、再現される。

ここが核心だ。PDFが保存しているのは、文書の「見た目」なのだ。

PDFの内部は、座標を指定して描画命令を並べた構造になっている。「この座標にこの大きさでこの文字を描け」、「ここに画像を配置しろ」という指示の集合体であって、「ここは見出しである」、「これは本文の段落である」、「この文は前の段落に続く」といった意味的な構造は、基本的に保持していない。

「改行」すらPDFの内部には存在しない。視覚的な改行は、次の描画命令のY座標が変わることで表現されているにすぎない。

つまりPDFは、デジタルの力で完全に再現された「紙」なのだ。紙と同じように、レイアウトは完璧に保存される。紙と同じように、中身を別の用途に再構成することは容易ではない。

PDFからテキストをコピーしたとき、文字の順番がばらばらになったり、改行位置がおかしくなったり、表が崩壊したりした経験のある人は少なくないだろう。これはPDFの不具合ではなく、そもそもPDFが文章の論理構造を記録するようには設計されていないことの帰結だ。同じPDFでもビューアによって抽出結果が異なるのは、ビューアが座標情報から文の順序や行の区切りを「推測」しているためにすぎない。

なお、PDFの仕様にはTagged PDFと呼ばれる構造情報を埋め込む仕組みも存在する。見出しや段落などの論理構造をタグとして付与するものだ。しかし現実には、この機能が適切に実装されているPDFはごく少数であり、ほとんどのPDFはやはり「見た目の記録」にとどまっている。

コンテンツと見た目の分離という未解決問題

PDFの限界を目にすると、自然に一つの問いにたどり着く。文書の「内容」と「見た目」を分離して扱えないのか、と。

「コンテンツとプレゼンテーションの分離」は、情報技術の世界で繰り返し挑戦され、そして完全には達成されていない課題だ。多くの人が取り組み、苦心し、それでもなお決定的な解決には至っていない。

HTMLとCSSは、Webの世界でこの分離を試みた最も広く知られた例だろう。HTMLが文書の構造と意味を記述し、CSSが見た目を制御する。理念としては美しい。しかし実際のWeb開発の現場では、構造と見た目は複雑に依存し合い、きれいな分離が保たれることは稀だ。

LaTeXは学術分野で独自のアプローチを取った。著者は \section{}\begin{theorem} といった論理的な構造だけを記述し、組版の細部はエンジンに委ねる。学術論文の組版においては強力だが、記法の学習コストの高さもあって、一般に広く普及するには至っていない。

Markdownは軽量さと読みやすさを武器にした。構造を最低限の記法で表現でき、書く側の負担は小さい。ただし表現力には限界があり、複雑なレイアウトや細かな視覚的制御には向かない。

どれも一長一短であり、「これさえ使えば万事解決」というフォーマットは存在しない。

そして、この問題が技術的に難しいのには理由がある。そもそも「コンテンツ」と「見た目」の境界そのものが曖昧なのだ。文字の太字強調は「意味」だろうか、「装飾」だろうか。箇条書きという形式は「論理構造」だろうか、「表示方法」だろうか。段落の間隔は「構造の区切り」だろうか、「視覚的余白」だろうか。こうした問いに一意の答えはない。見た目とコンテンツの分離は、言うほど簡単ではないのだ。

情報は散らばり、集めても使えない

フォーマットの問題と並行して、情報そのものの管理にも深刻な課題がある。

組織ではミーティングが日常的に開かれ、そこで共有された情報は議事録に残ることもあれば、そのまま流れていくこともある。チャットツールには膨大なやり取りが蓄積され、その中に重要な決定や貴重な知見が埋もれている。ファイルサーバには無数のフォルダが並び、同名の文書の異なるバージョンが散在する。

「すべてを一カ所に集約すればいい」という提案はよく聞く。しかし、それだけでは解決にならない。情報が一カ所に集まっても、構造化されていなければ、巨大な文書の山の前で途方に暮れるだけだ。

これは身近な場面で容易に想像できる。百科事典のような教科書を頭から通読しても、体系的な理解は得られない。あらゆる情報が一冊に収まっていることと、その情報を実際に理解し活用できることは、まったく別の問題だ。

情報には、適切な構造と、必要に応じて異なる角度から参照できる柔軟性が求められる。同じ内容であっても、全体を俯瞰したい場面と特定の詳細に集中したい場面がある。そのどちらにも対応するためには、情報が固定的な「見た目」に閉じ込められていてはならない。

発表と参考資料のジレンマ

ここで正直に一つの矛盾を認めたい。

情報は柔軟なデータとして保存されるべきだと主張しておきながら、自分自身が発表する側に回ったとき、実際にはどうしているか。スライドにはほとんど文字を載せない。長い文章を並べても、人には伝わらないからだ。図や図解を中心に構成し、説明は口頭で補う。発表原稿は別途作り込むが、聴衆に配布するわけではない。

そして、そうやって作った発表資料を後から「参考資料」として渡されたとしたら。はっきり言って、使い物にならない。図だけでは文脈がわからず、発表時の口頭説明なしには意味をなさないからだ。

これは個人の力量不足の問題ではなく、構造的なジレンマだ。

良い発表資料と良い参考資料は、求められる性質が根本的に異なる。 発表資料は、限られた時間で聴衆の注意を引き、要点を視覚的に印象づけることが目的だ。文字は最小限に抑え、図を大きく、テンポが重視される。一方、参考資料は、網羅性と正確性が要求される。文脈を自ら補い、後日読み返しても単体で意味をなす必要がある。

同じ知識を伝えるのに、最適な「形」が文脈によって全く異なる。ここにも、コンテンツとプレゼンテーションの問題が顔をのぞかせる。

もし情報が見た目から独立したデータとして保存されていれば、同じ内容を発表用のスライドとしても、後から参照する詳細資料としても、自在に出力できるはずだ。内容は一つ。見た目は用途に応じて変える。それが理想だ。しかし現実には、そのような仕組みはまだ広く実現されていない。

データとしての文書へ

率直な願望を言えば、見た目はどうでもいい。元のデータがほしい。

すべての文書をMarkdownで記述しろとは言わない。しかし、少なくともソースファイルにアクセスできるだけで状況は大きく変わる。PDFしか手に入らない現状では、内容を再利用するためにOCRや手作業による再入力が必要になることも珍しくない。元の構造化されたデータがあれば、検索、翻訳、要約、引用、形式変換のいずれも格段に容易になる。

見た目は必要なときに必要な形で生成すればいい。大切なのは、内容のデータが構造を保ったまま保存されていることだ。

次の一歩を

PDFは偉大な発明だった。紙を電子化し、どこでも誰でも同じ文書を同じ形で読めるようにした。その功績は揺るがない。

しかしPDFは到達点ではなく、通過点だ。

月面に降り立ったアームストロング船長の一歩は、宇宙開発の終わりではなく始まりだった。紙からPDFへの移行がデジタル文書における偉大な一歩だったとすれば、次の一歩は「見た目」から「コンテンツ」への転換ではないだろうか。

見た目に閉じ込められた情報を、構造を持ったデータとして解放すること。固定されたレイアウトの再現から、用途に応じた柔軟な表示への移行。それが次に踏み出すべき一歩だと思う。

その一歩を、切に待ち望んでいる。

Read more

暇が怖いだけ

今日あなたが「忙しい」と口にした回数を数えてみるといい。三回を超えていたら、それはもう事実の報告ではない。呪文だ。唱え続けることで、自分に存在価値があると確認するための。 忙しさは現代における最も手軽な自己証明になった。忙しくしていれば、少なくとも何かをしていることにはなる。何かをしていれば、生きている意味を問わなくて済む。逆に言えば、暇になった途端に、その問いが戻ってくる。だから人は忙しくする。忙しくあろうとする。忙しいと言いたがる。鎖を愛した動物のように、自分でかけた拘束を手放せない。 ここに一つ、居心地の悪い問いを置いておく。あなたが一日のなかで一番多くの時間を費やしていることは、あなたが一番大切にしていることと一致しているか。一致していないとしたら、その時間は誰のものなのか。 守られない時間 約二千年前、ストア派の哲学者セネカは『人生の短さについて』でこう嘆いた。人は財産や金のことになると吝嗇になるのに、時間を浪費することには驚くほど無頓着だ、と。時間こそ、最も惜しむべきものであるにもかかわらず。 この指摘は二千年経っても古びていない。むしろ悪化している。 財布か

By Sakashita Yasunobu

意味という病

あなたの人生に意味があるかどうか、宇宙は一度も気にしたことがない。 太陽は46億年前から燃えている。地球は回り続けている。そのどこにも、あなたの存在を前提とした設計図はない。もし明日、人類がまるごと消えたとしても、星は瞬き続ける。海は満ちて引く。何も変わらない。 それなのに、人は意味を求める。仕事に意味を、人間関係に意味を、生きていること自体に意味を。朝起きるたびに、意識するにせよしないにせよ、「なぜ」という問いがどこかで回っている。 これは病だと思う。 治す方法があるのかどうかも分からない、厄介な病だ。 観客のいない劇場 一つ、思考実験をしてみる。 もし宇宙のどこにも、人間以外の知的生命体がいなかったとしたら。誰も人類の存在を知らず、誰も観察しておらず、誰も記録していなかったとしたら。人間がこの星の上で営んできたすべてのこと、文明、芸術、戦争、愛、それらに意味はあるだろうか。 直感的には「ある」と言いたくなる。でも、その「ある」の根拠を言語化しようとすると、途端に足元が崩れる。 意味というのは、誰かがそれを認識して初めて成立するものだという立場がある。であれば、宇

By Sakashita Yasunobu

優しい人から壊れる

友人が泣いている。あなたはその隣に座って、背中をさする。言葉が見つからないまま、ただそこにいる。胸が詰まる。相手の苦しみが、自分の胸にも流れ込んでくるような気がする。 それは美しい光景だ、と誰もが言う。 ただ、もう少しだけ先を考えてみてほしい。あなたが感じているその痛みは、本当に相手の痛みだろうか。それとも、相手の痛みに触発された、あなた自身の別の何かだろうか。そして、その区別がつかなくなったとき、壊れるのはどちらだろう。 スポットライトの外は暗い 共感には奇妙な性質がある。近くにあるもの、目に見えるもの、名前と顔があるものに、不釣り合いなほど強く反応する。 イェール大学の心理学者ポール・ブルームは2016年の著書 Against Empathy で、共感をスポットライトに喩えた。照らされた一点だけが鮮やかに浮かび上がり、その外側は真っ暗なままだ。一人の子どもが井戸に落ちれば世界中が涙を流すが、統計の中で消えていく数万の子どもたちには何も感じない。 ブルームの指摘はさらに厄介な方向へ進む。共感はバイアスに満ちている。自分に似た人、魅力的な人、同じ民族や国籍の人に対して、よ

By Sakashita Yasunobu

何も起きなかった日

先月の火曜日に何をしていたか、思い出せるだろうか。 おそらく思い出せない。それは記憶力の問題ではなく、何も起きなかったからだ。何も起きなかった日は記憶に残らない。記憶に残らない日は、振り返ったとき、最初からなかったのと区別がつかない。 人生の大半は、こういう日でできている。 溶けていく曜日 子供の頃の夏休みは果てしなく長かった。35日間が、体感では半年くらいあった。ところが大人になると、半年が体感で35日くらいになる。時間の流れ方が、どこかで反転している。 神経科学者のデイヴィッド・イーグルマンは、この現象を記憶の密度から説明している。脳は新しい経験に遭遇すると、より多くの情報を符号化する。記憶が密であれば、あとから振り返ったとき、その期間は長く感じられる。逆に、毎日が同じパターンの繰り返しなら、脳は記録すべきものをほとんど見つけられない。記憶はスカスカになる。スカスカの記憶を振り返ると、時間はあっという間に過ぎたように感じる。 つまりルーティンは、主観的な人生を縮めている。比喩ではない。知覚の構造として、そうなっている。毎日同じ道を歩き、同じ時間に同じ席に座り、同じもの

By Sakashita Yasunobu