理解の価値と圧縮について
- 谷川綜太郎(千葉大学)
- 日本科学哲学会第56回大会(2023年12月2–3日、筑波大学)
イントロダクション
理解
- 理解(understanding)の概念は、認識論や科学哲学、認知科学、計算機科学などの様々な分野で重要である。
理解と認識的価値
- 認識論では、近年、理解に関する研究が盛んである。
- 認識論はしばしば知識(knowledge)を分析するプロジェクトだと考えられてきたが、近年の認識論には多様な展開がある。たとえば、価値駆動型の認識論(value-driven epistemology)と呼ばれる近年の研究動向では、認知的成功に付随する価値、すなわち認識的価値(epistemic value)に対する関心に動機付けられる仕方で認識論を再構築しようとする。
- こうした理念を共有する認識論者たちは、より多様な認識的価値に焦点を当てるために、知識以外の概念にも目を向けてきた。理解はそのうちの一つであり、また、特に盛んに議論されてきたものである。
- こうした経緯から、理解にはどのような(固有の※1)認識的価値があるか、という問題が現在動機付けられている。
- ※1 「固有の」=「(知識などの)他の認知的成功には付随しない」
- こうした問題に対して、認識論者たちは主に次のような仕方でアプローチしてきた:
- 自分が知っていることを知らないまま知ることはできるが、自分が理解していることを知らないまま理解することはできない。したがって、理解には懐疑的な不安に脅かされないという利点がある。(Zagzebski 2001)
- 認知的達成(cognitive achievement)を伴わずに知ることはできるが、認知的達成を伴わずに理解することはできない。そして、達成には一般に最終的価値がある。したがって、理解には達成としての価値がある。(Pritchard 2010)
- 好奇心を充足するものには反応依存的(response-dependent)な価値がある。そして、好奇心(curiosity)を充足するものは(知識ではなく)理解である。したがって、理解には好奇心を充足するものとしての価値がある。(Kvanvig 2013)
圧縮としての理解
- 他方で、理解に関する哲学的な議論の系譜は、科学哲学にも存在する。
- 伝統的な科学哲学者たちは、科学的な理解を、正しい説明(correct explanation)についての知識、という観点から説明してきた。また、近年では、表象(representation)を操作する能力、という観点から説明する立場も有力である。
- Kelp(2015)は、この二つの立場、すなわち説明主義(explanationism)と操作主義(manipulationism)が、科学的理解に関する現在の主要な立場だと述べている。また、Kelp自身は、最大限の理解(Max-U)とそこからの距離によって理解度(Deg-U)を定義する代替アプローチを提案しており、こちらも有力だと思われる。
- Wilkenfeldは、「表象操作可能性(representation manipulability)としての理解」(2013)という概念を提唱したことにより、操作主義の中心的な人物だと見なされているが、後に、その後継とも言える「圧縮(compression)としての理解」(2019)という概念を提唱している。
- 理解をある種のデータ圧縮(data compression)だとする考え方はしばしば出現しているようだが(たとえば、Chaitin 2006)、発表者の見る限り、Wilkenfeld(2019)はそのような考え方を最も体系的に示している。
- 「圧縮としての理解」(Wilkenfeld 2019)は、科学哲学における議題を超えて、理解に関する「可能な限り統一的な説明を構築すること」(p. 2809)を目指して作られている。
- 説明主義や操作主義と比べて「圧縮としての理解」が興味深い点は、後で見るように、理解の固有の価値をうまく示せるように見える点である。
この発表について
- この発表では、「圧縮としての理解」の観点から、理解にはどのような(固有の)認識的価値があるか、という認識論上の問題に応答する方法を確認した後、この考え方を批判的に検討する。
圧縮としての理解
Wilkenfeld(2019)による定式化
- 圧縮としての理解(UC): ある人p1が対象oを文脈Cにおいて他の人p2より理解しているのは、p1がoについて正確(accurate)でより小さい記述長(description length)からCにおいて有用な種類の情報(少なくとも、どの情報がCにおいて関連性を持つかについてのいくつかの高次の情報を含む)を生成できる表象/プロセスのペアを持っているときに限る。(p. 2811)
UCの例
- 学習における理解の例: 論理学の教育を受けた人々の多くは、一階述語論理の自然演繹体系の健全性の証明を理解しているかもしれない。とはいえ、彼らはその証明プロセスのすべてを暗記しているわけではない。多くの場合、彼らは基本的な事実に加えて、証明を再構成するためのルールやヒューリスティックス、仮説などを持っており、それらを用いて証明を再構成できる。
- より歴史的な理解の例: アダム・スミスの『国富論』は、市場メカニズムに関するわれわれの理解を飛躍的に推し進めた。いまやわれわれは、現実の社会状況に関する多くの複雑な事実を読み込むことなく、いくつかの基本的な事実と、需要と供給に関する簡単な原則を用いて、市場価格に関する有用な情報を生み出せる。(たとえば、メキシコ湾をハリケーンが襲ったときに原油価格はどうなるか、という議題に関して有用な情報を生成できる。)
UCの価値
- 記憶領域の節約: たとえば、最初の50個のフィボナッチ数を暗記している人よりも、フィボナッチ数を定義する簡単な漸化式からそれらを生成できる人のほうが、UCの観点から見て(フィボナッチ数についての)良い理解を持っている。このとき、後者のほうが記憶領域を節約できているという事実が、UCの価値を説明している。
- 過学習の回避: たとえば、あるデータを(過学習して)無用な 10次関数で理解している人よりも、誤差項を含む有用な2次関数で理解している人のほうが、UCの観点から見て(データについての)良い理解を持っている。このとき、後者が過学習を回避できており、前者はできていないという事実が、UCの価値を説明している。
UCを検討する
- UCが真であれば、理解の固有の価値を説明する、という認識論の要求にもうまく対応できるように思われる。というのも、標準的な考え方※1からすると、知識の良し悪しに関して圧縮率が評価されることはないだろうし、知識の概念を調べたところで、提示されているような価値(記憶領域の節約・過学習の回避)は出てこないだろうからである。
- ※1 標準的な考え方では、知識は真なる信念の一種であり、その良し悪しは、通常、証拠の質や獲得プロセスの信頼性などに基づいて評価される。
- しかし、よく検討してみると、UCは偽であるように思われる。以下では、UCをそのまま(理解の定義として)受け取った場合と、より弱めて(理解を評価するための単なる基準として)受け取った場合に分けて、それぞれの場合での問題点を示す。
UCはどのような主張か
- 議論の前提として、まずは、UCがどのような主張かを確認する。
- 公式の説明にもあるように、UCは、モデル選択における最小記述長(minimum description length = MDL)原理の基本的な考え方※1を、理解についての概念的主張として述べ直したものである※2。
- ※1 Wilkenfeld(2019)が参照しているGrünwald(2004)では、MDLの中心的洞察を次のように特徴付けている。「「学習」を「規則性の発見」と同一視するなら、データを圧縮できればできるほど、データについてますます学習したことになる」(p. 5)
- ※2 Wilkenfeld(2019)は次のように述べている。「MDLの支持者たちは、人々が実際にどのように学習するかについての経験的主張として、MDLを提唱している。私の提案は、少なくともある抽象レベルにおいて、彼らが(も)特定したことは、良く学習すること、すなわち理解すること、についての概念的真理だ、と主張することである」(p. 2811)
- 要するに、MDLとUCは基本的な考え方を共有しているが、MDLは学習を評価するための(経験的)基準を与えるものであり、UCは理解の(概念的)定義を与えるものである。
- 以上の前提を踏まえて、以下では、まず、UCが概念的主張として(すなわち、理解の定義として)正しくない理由を説明する。
UCが(概念的主張として)正しくない理由
- UCを(理解の定義として)受け入れるなら、UCの価値についての説明(記憶領域の節約・過学習の回避)も(理解の価値についての説明として)受け入れる必要がある。
- ここで一つ前提を追加する。それは、理解の価値についての説明は、われわれが理解を求める理由についての説明でなければならない、という前提である。この前提が受け入れられるなら、UCの説明(記憶領域の節約・過学習の回避)は少しずれているように思われる。
- 何がずれているかを明らかにするために、参考としてMDLの価値を考える。MDLの端的な主張は、「与えられたデータの最良の説明は、そのデータの最短記述によって与えられる」(Grünwald 2019, p. 1)というものである。すなわち、ここではまず最良の説明を得たいという動機があり、MDLはそのための手段として提案されている。このことを考慮すると、MDLの端的な価値は、(それを採用することにより)最良の説明を得られる、という点にある。他方で、UCの価値として強調されている「過学習の回避」は、MDLの強みとしても挙げられている(Grünwald 2004, p. 5)が、これはあくまでも最良の説明を得るという目的に照らして、MDLが他の(モデル選択)戦略よりも優れていることをアピールするものである。
- 理解についても同様に考えるなら、仮に経験的主張としてのUCが真だったとしても、定義の焦点は別のところにあるべきだと思われる。たとえば、いかに情報を圧縮できているか、という点よりは、いかに有用な情報を生成できるか、という点に焦点があるほうが望ましいと思われる。そうしたほうが、理解の価値についてのより直観的な説明を与えられるだろうからである。(すなわち、「記憶領域の節約」や「過学習の回避」という価値に焦点を当てるよりも、「有用な情報を生成できる」という価値に焦点を当てるほうが、われわれが理解を求める理由についての直観的な説明を与えられるだろう。)
- したがって、UCが理解の定義として正しくない理由は、理解の価値についての直観的な説明を与えられないからである。これは規範的な観点からの結論だが、以下では、さらに、UCが経験的主張としても(すなわち、理解を評価するための単なる基準としても)正しくない理由を説明する。
UCが(経験的主張としても)正しくない理由
- MDLとUCは、情報の圧縮率が高いほど優れている、という共通の考え方を持っている。しかし、この考え方は、モデルの評価基準としてはある程度有効であっても、理解の評価基準としてはあまり有効でないように思われる。
- UC論文でUCのパフォーマンスを示すために用いられている理解の例を見てみると、論理体系の健全性の証明や、マクロ経済現象、フィボナッチ数、関数でうまく近似できるデータなどの、比較的規則性を発見しやすく、モデリングしやすい対象のみが選ばれているように見える。しかし、実際の理解の対象には、より規則性を発見しづらく、モデリングしづらい対象も含まれていると思われる。以下では、そのような対象についての理解に焦点を当てることで、UCが経験的主張としても正しくないことを示す。
規則性を発見しづらい例
- 学生の「日本史」理解を「試験」で評価することを考える。UCの観点からは次のような基準が置かれる:
- ある学生s1が「日本史」を「試験」において他の学生s2より理解しているのは、s1が「日本史」について正確でより小さい記述長から「試験」において有用な種類の情報(少なくとも、どの情報が「試験」において関連性を持つかについてのいくつかの高次の情報を含む)を生成できる表象/プロセスのペアを持っているときに限る。
- 基本的な事実として、日本史には(ほとんど)規則性がない。したがって、(フィボナッチ数を圧縮して再生成するのと同じ意味で)日本史に関する情報を圧縮して再生成することはできない。
- 他方で、UCをもっともらしいと思わせる直観もある。それは、たとえば、日本史の教科書をすべて暗記している学生は、日本史を(ほとんど)理解していないだろう、という直観である。
- しかし、こうした直観がUCを支持するわけでもない。なぜなら、多くの学生は、教科書をすべて暗記しているわけではないが、かといって圧縮しているわけでもないからである。これは、彼らが実際に行っていることを考えてみるとよくわかる。彼らが実際に行っていることは、どの情報が(試験において)重要か、という点に関するメタ認識を行ったうえで、暗記する情報を制限する、ということである。すなわち、核となるロジックから有用な情報を生成できるようになっているわけではないので、これを圧縮を呼ぶことはできない。
- また、切り口を変えて、実際にこうした文脈ではどのように理解が評価されているか、という点を考えてみると、UCではそれらを十分に評価できないことがわかる。たとえば、実際の歴史の試験では、単に知識を問う問題に加えて、歴史上の出来事や因果関係などを説明させる問題が出題されている。こうした出題には、基礎的な知識の確認だけでなく、理解の深さを問う意図もあり、そこではかなり多様な項目(事実認識の正確さや、情報を相互にどのように関連付けているか、視点の網羅性など)が評価される。しかし、UCは圧縮率だけで理解に優劣をつける指標なので、こうした評価の次元を捉えられない。
小まとめ
- このように、理解は多様な観点から評価される。今回の議論にはいくつかの自明でない前提が含まれていたかもしれないが、圧縮の観点から理解を統一的に評価することは難しい、ということは示唆できたのではないかと思われる。
まとめ
- 情報の適切な圧縮には、確かに独特の認識的価値(記憶領域の節約・過学習の回避)がある。これらの認識的価値は、おそらく知識の概念からは出てこないものであり、その点では興味深いものである。
- しかし、理解を圧縮の観点から定義することには問題があり、また、単に評価の基準として利用することにも問題がある。代替案を提案するためにはさらに多くのことが必要だが、少なくとも今回はUCの説明が失敗していることを示した。
参考文献
- Gregory Chaitin. (2006). The limits of reason. Scientific American 294.3: 74–81.
- Peter Grünwald. (2004). A tutorial introduction to the minimum description length principle. arXiv:math/0406077v1.
- Peter Grünwald. (2019). Minimum description length revisited. arXiv:1908.08484v2.
- Christoph Kelp. (2015). Understanding phenomena. Synthese 192.12: 3799–3816.
- Jonathan Kvanvig. (2013). Curiosity and the response-dependent special value of understanding. Knowledge, Virtue, and Action, Routledge: 151–174.
- Duncan Pritchard. (2010). Knowledge and understanding. The Nature and Value of Knowledge: Three Investigations, Oxford University Press: 1–88.
- Daniel Wilkenfeld. (2013). Understanding as representation manipulability. Synthese 190.6: 997–1016.
- Daniel Wilkenfeld. (2019). Understanding as compression. Philosophical Studies 176.10: 2807–2831.
- Linda Zagzebski. (2001). Recovering understanding. Knowledge, Truth, and Duty: Essays on Epistemic Justification, Responsibility, and Virtue, Oxford University Press: 235–252.
Back to homepage