
◉ 私たちの時代の統計学の教科書にも、その片隅に「原因の確率」という項目があって、いろいろな種類の演習問題をベイズの定理で解かされたものです。ベイズ流の統計手法は、今や、AI やデータサイエンス分野の統計的推論においては必須テクニックです。本書『異端の統計学 ベイズ』では、ベイズ統計学が、長い間、異端視されて苦難の道を歩み、学問としての市民権を得たのは1950年代以降だったこと、そして、経営学、データ解析、人工知能へと適用分野を広げつつ、顕著な成果を生み出してきたことが詳細に語られます。
その学問分野の発展の歴史を学ぶと、教科書からは得られない本質にせまることができます。本稿では、ベイズ流統計学を究めるための格好の副読本、マグレイン『異端の統計学 ベイズ』を読み解きます。
1.マグレイン『異端の統計学 ベイズ』の紹介
▶ シャロン・バーチュ・マグレイン『異端の統計学 ベイズ』、草思社文庫(2018)、pp.650
本書は、イギリスの長老派牧師で数学愛好家でもあったトーマス・ベイズ師(1701-1761)の発見に端を発する「ベイズ統計学」の歴史物語です。本書の8割ほどは、ベイズ統計学が著しい成功を収めた様々な事例の詳細な物語で、ベイズ統計やベイズ推論を実際に使ってみようという人たちにとっても、格好の副読本となっています。著者のマグレインは『お母さん、ノーベル賞をもらう: 科学を愛した14人の素敵な生き方』(本稿《5-1》参照)で知られるアメリカのサイエンスライターで、調査能力、構成力、文章力には定評があります。
1-1 頻度主義とベイズ主義
さて、本書、統計学の本流であり正当派とされる頻度主義統計学と、傍流として異端視されるベイズ主義統計学の対決の構図で貫かれています。自然科学の規範を逸脱しないことを重視する一派、軽々と社会学や経営学との境界領域に踏み込んでなお、自然科学であると主張する一派の戦いでしょうか。
ところで、頻度主義統計学とベイズ主義統計学の本質的な違いは、本書内でも簡潔な言葉で説明されてはいるものの、どうも腑に落ちないという読者も多いのではないでしょうか。そこで、この分野の専門家の著作、松原望『ベイズ統計学概説:フィッシャーからベイズへ』(本稿《2-2》)や、ジェームズ・V・ストーン『速習 ベイズの定理:推論に効く数学の力』(本稿《2-1》)を参考にして、すこしだけ、補足しておきましょう。
ベイズと言えば、原因の確率とか逆確率の話しがメインですが、ベイズの定理からは順方向の普通の「確率」の扱い方も導かれます。それについて、ストーンの『速習 ベイズの定理: 推論に効く数学の力』は、
頻度論者は「現実世界に属する性質」として確率を捉えているのに対して、ベイズ論者は「現実世界に関する知識の不確実性の尺度」として捉えている(ストーン『速習 ベイズの定理: 推論に効く数学の力』、p.124)
と述べた上で、つぎのようなサイコロ投げにおける「確率」の見方の違いを示します(以下,若干の脚色あり)。
頻度論者は事前知識がなければ「3の目が出る確率」を1/6と仮定したうえで、必要ならば膨大な実験を厭わず、万人が納得するそのサイコロに対する客観的な頻度データを得ることに努力します。そして、試行を無限回に移行したときの推定値を弾き出します。一方、ベイズ論者は、一回振って3の目が出れば、確率 1.0 などとし、以後、試行の度に自分自身にとっての確率を更新していくのです。さらに、極端にいえば、その試行を高速度カメラに収めてコマ送りにし、その状況から、時々刻々と変わるサイコロの運動に関する知見をもとに、自分自身の確率を更新してもいいわけです。探訪堂も大好き、カルマンフィルターの世界ですね。サイコロが止まる寸前、一つの稜線がテーブルに接してかろうじてバランスしそうならば、答えは、例えば3か6となって、3の目の出る確率は、その瞬間では 0.5であるという具合です(この方法、振る前には通用しないので無価値ですが、、、)。
確率的事象がもつ不確実性をなんとか評価しようとする意思決定者が、如何なる「観測」によってデータを得ているかは重要な条件です。サイコロの例でいえば、見る角度や記録する頻度(ひとりは10回に1回しか記録できないが、他のひとりは毎回記録できる等々)によって、各個人がもつ「不確実性の尺度としての確率」が変わります。そのため、頻度論者は「主観確率」などと呼んで、これを異端視するわけです。科学的な議論に対して「主観確率」というのは侮辱として絶妙で、「おーい、山田くーん、ザブトン1枚」という話しで、せめて個人確率と呼んでほしいようです。
ところが、ベイジアンのなかには、それを逆手にとって、不確実性を測る尺度の背後に意思決定者がもつ価値体系の存在などを想定し、積極的に「主観確率」を前面に出して、それを理論武装する研究者も現れます。ベイジアン、恐るべしですね。結局のところ、行動するための統計学は調べたら終わりではなく、公共政策立案であれ、会社組織の舵取りであれ、損得の判定に拘わる意思決定問題に援用するわけですから、まさに、このためにこそベイジアンが誕生したともいえるでしょう(エイブラハム・ワルドの『統計的決定関数』など;本書『異端の統計学 ベイズ』、p.321)。
とはいえ、フィッシャー、ネイマン、ピアソンらの正当派統計学が数理的な確率論と結びついて「数学」の一分野と認められたのも、恐らく20世紀前半で、大昔から「数学の正当派」であったわけでもなく、一方の「ベイズ統計学」といえば「応用数学」の一分野として認める人が増えたとはいえ、少なくとも日本では、現在でもその応用は数学の外縁部である「数理科学」に属するものとして、ゲーム理論などに近いとする研究者も多いようです。なお、裁判における因果関係の判定にベイズ主義統計学を使うことには、現在でも強い抵抗があるとのことです。まぁ、主観的ですから当然ですか?
1-2 本書『異端の統計学 ベイズ』について
ようやく、本書の紹介にたどり着きました。
文庫判、650ページ、厚み29ミリ。ページを開いたままにするのが一苦労で、私、探訪堂は、準備資料の打ち込みに際しては、幅65ミリの目玉クリップ2個をページの上下に使って応戦してます。

序文、および読者の皆さんへのただし書き
【第1部 黎明期の毀誉褒貶】
第1章 発見者に見捨てられた大発見
第2章 「ベイズの法則」を完成させた男
第3章 ベイズの法則への激しい批判
【第2部 第二次大戦時代】
第4章 ベイズ、戦争の英雄となる
第5章 再び忌むべき存在となる
【第3部 ベイズ再興を志した人々】
第6章 保険数理士の世界からはじまった反撃
第7章 ベイズを体系化し哲学とした三人
第8章 ベイズ、肺がんの原因をつきとめる
第9章 冷戦下の未知のリスクをはかる
第10章 ベイズ派の巻き返しと論争の激化
【第4部 ベイズが実力を発揮しはじめる】
第11章 意思決定にベイズを使う
第12章 誰がフェデラリスト/ペーパーズを書いたのか
第13章 大統領選の速報を支えたベイズ
第14章 スリーマイル島原発事故を予見
第15章 海に消えた水爆や潜水艦を探す
【第5部 何がベイズに勝利をもたらしたか】
第16章 決定的なブレークスルー
第17章 世界を変えつつあるベイズ統計学
補遺a 「フィッシャー博士の事例集」:博士の宗教的体験
補遺b 乳房X線撮影と乳がんにベイズの法則を適用する
本書の、オリジナルは
- Sharon Bartsch McGrayne、The Theory That Would Not Die: How Bayes' Rule Cracked the Enigma Code, Hunted Down Russian Submarines, and Emerged Triumphant from Centuries of Controversy(この理論は死なない: ベイズの法則は、如何にしてエニグマ暗号を解読し、ロシアの潜水艦を追跡し、何世紀にもわたる論争を勝ち抜いたか), Yale University Press (2011)
です。まず、文庫本版の帯を確認しておきましょう。

ベイズ統計やベイズ推定に関連した入門書が量産されていますが、本書は数式をほとんど使うことなくベイズ統計学の歴史と、絶大な効果を発揮した多数の事例が紹介されています。
1-3 ベイズ統計学の物語
物語は、ロンドン近郊の小さな温泉街、タンブリッジ・ウェルズの牧師、トーマス・ベイズ師が、逆確率の問題に関する驚くべき解法を思い付くという場面から始まります。私、探訪堂流に解釈すれば、
- ある命題(A)が真であると確信するに足る確率(事前確率 p(A))が知れたとき、その後起こった事象(X)の観測事実が手に入れば、その観測事実(X)の下で命題(A)が真である確率(事後確率 p(A|X);AただしXなどと読む)が簡単に求められる
のです。こうして、命題(A)成立の必要条件としての観測事実(X1、X2、、、、)を積み重ねることで、(A)が真である確率を次々に更新する、、、。 アマチュア数学研究家であったベイズ師の本件に関する遺稿は、友人、リチャード・プライス(1723-1791)の手に委ねられ、王立学会の「哲学紀要」に掲載されたものの、やがて忘れ去られます(この論文は閲覧可能です)。

偶然性の理論におけるある問題の解決に向けたエッセイ;故ベイズ師著、プライス氏による寄稿(An essay towards solving a problem in the doctrine of chances. By the late Rev. Mr. Bayes, F. R. S. communicated by Mr. Price, in a letter to John Canton, A. M. F. R. S)
The Royal Society、Philosophical Transactions of the Royal Society of London、Volume 53、 Issue 53、pp.370-418(1763)
次に登場するのは、フランスの天文学者、ピエール=シモン・ラプラス(1749-1827)です。この人、「ラプラスの悪魔」で有名な研究者で、いわゆる決定論的な宇宙観を世に広めましたが、一方、アブラーム・ド・モアブル(1667-1754)の『偶然性の理論』に影響され、天体観測における逆確率の問題、すなわち、観測誤差の原因の探求を開始します。ラプラスにとって、観測誤差など愚かな人間の所業以外の何ものでもなく、そして、それを証明する必要に迫られたのです。その過程で、ベイズの定理を再発見するのですが、のちに渡仏したプライスを経由してベイズ流の逆確率理論の存在を知ることとなります。両者の違いについて、マグレインは
ベイズやプライスが、今日水たまりができているという事実に基づいて、昨日雨が降った確率や明日雨が降る確率を求めたのに対して、ラプラスは、ある特定の量の雨が降る確率を求め、さらに新たな情報を得るたびにその値をどんどん改善してより正確にしていきたいと考えたのである。 (本書『異端の統計学 ベイズ』、p.64)
と記しています。素朴かつ牧歌的なベイズ=プライス理論に対して、ラプラスは天体の運動を相手にしているだけあって複雑なことを考えてます。この話しで想起されるのは、ラプラス流のベイズ公式を使った運動体の推定アルゴリズム(カルマンフィルター)が、粗末な観測機器で月面着陸を果たしたアポロ宇宙船の成功譚の影の主役だったということ。なるほどと納得できます(あれがなければ失敗してた?)。
科学界のビッグネーム、ピエール=シモン・ラプラスの参入でにわかに活気づいたベイズ統計学界隈ですが、その後,軍事技術として可能性が見いだされて本格的に使われ始めた途端、深く潜航し、学問の世界から不可視となります。軍は大喜びですが、学会において、枯れススキ状態のベイズ統計学には、批判の嵐が巻き起こり、そして、時は流れます。20世紀初頭は、正当派の頻度主義統計学の勃興期で、フィッシャーという近代統計学の創建者と、その後継者を自任するネイマン、ピアソン・ジュニア間の内輪もめも勃発します。しかし、第4章以降では、深く潜航していたベイズ流統計学が、秘密解除のおかげもあって、実は,第二次世界大戦、冷戦時代を通じて快進撃を続けていたという物語として、各話、非常に細密な描写で語られます。
「第4章 ベイズ、戦争の英雄となる」はドイツ軍のエニグマ暗号の解読に関する物語です。暗号といえば サイモン・シン『暗号解読(上下)』、新潮文庫(2001) ですが、すでに忘却の彼方。そこで、本棚から引っ張り出して点検してみると、エニグマ暗号とベイズ統計学の関連を示す記述は見当たりません。そこで、本書、『異端の統計学 ベイズ』の第4章をめくり直してみましたが、やはり、具体的な記述は見当たりません。要するに、軍関係の暗号解読に関する具体的な話しは何年経っても機密指定が解けないということのようです。そんなとき、頼りになるのは、松原 望『ベイズ統計学概説』。ありました、さすがです。「エントロピー尺度と統計学: 言語の「ムダ」の割合」というコラム記事です。それによれば、
言語は一般にマルコフ連鎖であるとされる。(数式登場、中略)ところで、条件は確率を逆方向に用いればベイズの定理(逆確率)、順方向に用いればマルコフ連鎖であるが、一般に「条件付確率」としての扱いは数理的に変わらず、エントロピーの計測は共通である。 (松原 望『ベイズ統計学概説:フィッシャーからベイズへ』、p.168より)
とのことでした。ここでの「エントロピー」はシャノンの情報論的エントロピーで、無意味にも見える文字列に潜む情報量の計測に使うということ。「逆方向に用いる」というのは、暗号文からエニグマ暗号機内の生成メカニズムを推定するということかと思います。なお、このコラムのあと、松原の教科書では、シャノンのエントロピー公理、シャノンに続く研究者たちの「情報数」の概念とかAIC(赤池情報量基準)の話しなどが続きます。奥深い話題ですが、どうやら、地下世界に潜行せず、学術の世界に浮き上がってくる議論もあるようですね。著者のマグレインは、エニグマ暗号解読とベイズ統計学のつながりを明言していますから、関係者へのインタビューから大筋をつかんでいると憶測しています。
私、探訪堂は、米国、ランド研究所の研究者たちの動向を1950年代を中心に調べていて、勝手にひとりで喜んでいますが、「第9章 冷戦下の未知のリスクをはかる」は、なんと、ストックオプションの価格決定理論等で有名なアルバート・マダンスキー(1934-2022)が主役なのです。若かりしマダンスキーが、核兵器事故を回避するための安全システム、許認アクションリンク(PAL;邦訳は核発射統制装置)の概念研究に参加した当時の様子が描かれていて、かなり貴重な資料となっています。統計学者、ジミー・サヴェッジ(1917-1971)から水素爆弾が事故で爆発する確率の算定を求められた博士号取得直後のマダンスキーは、それまで核兵器事故ゼロという記録に当惑し、頻度主義統計学では扱えない問題であることを確信します。そして、事故に至らないまでも、関連するトラブル事例が少なからず存在することを突き止め、それらのデータも取り込み、ベイズ統計学を駆使して報告書をまとめます。その結果、あの極悪非道のカーチス・ルメイ将軍が慌てふためく様子などが活写されています。ワクワクしながら、興味深く拝読させて頂きました。未だ秘密解除に到っていないレポートも多いようで、いい意味で、逆に謎が深まったりしてますが、あのダニエル・エルズバーグも登場して、臨場感にあふれています。それにしても驚異的な取材力と構成力、恐れ入りました。他の章も、興味深い話題で満載で、マニアにはたまらない第一級の情報源ですが、今は、このくらいにして、先を急ぎましょう。
≫ 【書評記事】 第3話 アベラ『ランド: 世界を支配した研究所』を読み解く
2.ベイズ統計学を知る
私、探訪堂は、システム理論史の探究をひとつのライフワークとしていますが、ノーバート・ウィーナーの『サイバネティックス』は私にとっても最重要の書籍です。原著第1版は1948年に刊行されています。そのなかで、ウィーナーは、頑固一徹の頻度論者であるフィッシャーが、ベイズの逆確率に対抗して「尤度(ゆうど;もっともらしさ)」という概念を展開していることについて、統計物理学のジョサイア・ウィラード・ギブス的な観点から、我々は過去を完全には知ることができないということを説明したあと、
尤度の理論は、それによってベイズの法則を使用する必要性を避け得るように見えるが、実はその使用の責任を、その問題に従事している統計学者あるいはその結果を実際問題に使用する現場の人々に転嫁するだけのことである。他方、理論を扱う統計学者は、やましいところがなく、完全に厳密でないことや非難の余地のあることは何もいわなかったということができるのである。 (ノーバート・ウィーナー『サイバネティックス(第2版)』、p.112)
と皮肉混じりに述べています。ウィーナーは、それまで科学の世界では御法度だった “科学理論に目標という概念を数理的に正しく入れ込むこと(目的論的機械論)” に成功した研究者で、恐らく大御所のフィッシャーは、畑違いのサイバネティックスの話しなど知る由もなく、頑なに統計的推測論に固執し、個人や組織の意思を科学に含める議論などは私の統計学の外でやってくれ、ということだったと思います。
ウィーナーは第二次世界大戦時、高射砲の射撃管制に関連して、独軍爆撃機の数秒後の位置推定に、のちにウィーナー・フィルタと呼ばれることになる予測アルゴリズムを活用していますが、そこには時系列データに対するベイズ流の推定公式が使われています。このことは、恐らく、1940年代半ば、サイバネティックス界隈ではベイズの法則の有効性が知れ渡っていたことを示唆します。残念ながら、マグレイン『異端の統計学 ベイズ』にはウィーナーやギブスに関する言及はありません。なお、上で引用したウィーナーの言葉は、サイバネティックス的な問題状況について述べており、正当派統計学、すなわち頻度主義統計学の重要性を否定するものではないことに注意が必要でしょう。
2-1 ジェームズ・V・ストーン『速習 ベイズの定理: 推論に効く数学の力』
「専門家も驚く」ほどのの分かり易さ、「ベイズの定理」入門書の決定版です。
▶ ジェームズ・V・ストーン『速習 ベイズの定理: 推論に効く数学の力』、技術評論社(2023)、pp.177
本書は、本稿冒頭の《1-1》でも紹介しましたが、[速習]を可能とするベイズの定理の入門書です。ここ数年、ベイズの定理に関する入門書は驚くほど多数出版されていますが、本書は、専門家も「それまで腑に落ちていなかったことが腑に落ちて感動した」と絶賛する参考書。著者のジェームズ・V・ストーンは、英シェフィールド大学の元准教授で情報理論、計算ニューロサイエンス、AI、量子力学の研究者、2017年からはライター業に専念するため独立しています。本書は、高校数学でベイズの定理の神髄を[速習]できるよう、様々な工夫がほどこされており、多数の図表や分かり易い数式表記を使い、具体的な例題を中心として話しが展開されます。少し深く学ぶための記事は、巻末のAppendixにまとめられています。

ジェームズ・V・ストーン『速習 ベイズの定理』の裏表紙から
1章 ベイズの定理への招待
2章 図解でわかるベイズの定理
3章 離散パラメーターの推定
4章 連続パラメーターの推定
5章 正規分布のパラメーター推定
6章 ベイズの定理に対する鳥瞰図
7章 ベイズ論争
Appendix
A 基本用語の整理/B 数式に登場する文字や記号/C 確率の法則/D 確率密度関数/E 二項分布/F 正規分布/G 最小二乗法/H 参照事前分布/I MATLABのサンプルコード
本書の原著には、MatLabコード、Pythonコード、Rコードを添付した版もあるようです(書影は著者のホームページから)。

2-2 松原 望『ベイズ統計学概説: フィッシャーからベイズへ』
我が国のベイズ統計の第一人者による概説書。
▶ 松原 望『ベイズ統計学概説: フィッシャーからベイズへ』、培風館(2010)、pp.255
本書は「ベイズ統計学の入門的解説書」とされていますが、見た感じは本格的な概説書です。一般的な大学教科書のボリュームですが、このページ数で、ベイズ統計学について知りたいことは網羅されています。また、コラムがたくさん挟み込まれていて、歴史的な解説や基本的な用語、概念の説明があり初学者への配慮がみられます。本文はほぼ数式で埋め尽くされていますが、ハードな内容ではありません。ただし、黒板書体で書かれたベクトルや行列を使った表式が現れ、その背後にはベクトルによる偏微分などが想定されています。本書、松原 望『ベイズ統計学概説』は、この手の専門書のなかでは秀逸なのですが、残念ながら、品切れ再版予定なしに分類されているようです。なお、より広範な読者を想定した同じ著者による入門書があります。次項《2-3》をご覧下さい。

- 標本理論入門
頻度主義に基づく統計的推測の基礎知識/頻度主義統計学のはじまり/ネイマン-ピアソン理論の基本的考え方/ベイズ統計学レビュー - ベイズ統計学の基礎
ベイズ統計学の発展/確率の頻度説/主観確率/ベイズの定理と事前確率分布/ベイズの定理からベイズ統計学へ/事後分布の極限/予測分布 - 事前分布の選び方
事前分布の選び方(1):自然共役分布/事前分布の選び方(2):リンドレーのあいまい事前分布/事前分布の選び方(3):ジェフリーズの不変原理/事前分布の選び方(4):ボックス・チャオの無情報的事前分布/事前分布と有意性検定 - 統計的決定と情報の価値
不確実性のもとでの意思決定/意思決定方式の順序付けと許容性/ミニマックス決定方式とべイズ決定方式/完全惜報の期待価値/ベイズ決定(推定)/不確実性下でのベイジアンコントロールと期待値の合理性 - 無情報的事前分布の応用
正規分布に対する推定/ベイズ回帰分析/ベイズ統計学の階層モデル/経験的ベイズの方法 - 統計的情報
統計理論と惜報/エントロビー/カルバック-ライブラーの情報数/連続情報源の通信理論 - ベイズ更新と逐次仮説検定
ベイズ更新による決定の考え方/逐次確率比検定/逐次決定問題 - ギブス・サンプリングによるMCMCのべイズ統計学への応用
シミュレーション/メトロポリス-ヘイスティングスによる標的密度のつくり方/ギブス・サンプリングとベイズ分析/完全条件付き分布でMCMCを実行する/WinBUGSの概観
参考・引用文献/索引
本書の著者、松原 望氏の論考は、1980年代初等の日本オペレーションズ・リサーチ学会誌にて拝読した覚えがあります。学会ホームページのアーカイブスにて一般公開されています。興味ある方はご覧ください。

日本オペレーションズ・リサーチ学会機関誌、Vol.28、No.9、pp.432-438(1983/09)
2-3 松原 望『改訂版 入門ベイズ統計』
我が国のベイズ統計の第一人者による入門書。
▶ 松原 望『改訂版 入門ベイズ統計』、東京図書(2024)、pp.288
ベイズ統計学の専門家、松原 望氏によるロングセラー入門書の改訂版です。初版は2008年、今回、新たにひとつの章が追加され、いくつかの章タイトルが変更されて、AIの時代に合わせた改訂がなされています。目次構成を比較して見てみましょう。時代の変化が感じられます。
第1章 ベイズの定理/第2章 ベイズ統計学の基礎/第3章 ベイズの定理の発展/第4章 情報と決定/第5章 パターン認識とベイズ判別問題/第6章 ベイズ階層モデル/第7章 ベイジアン・ネットワークの原理/第8章 ベイズ統計学とカルマン・フィルター/第9章 医学とベイズ意思決定/第10章 医薬とベイズ統計学/第11章 事後分布のシミュレーション/第12章 ベイズ情報統計学の発展/第13章 シンギュラリティとコンピューティングの将来
第1章 ベイズの定理/第2章 ベイズ決定の基礎/第3章 社会的リスクと決定/第4章 ベイズ判別問題とパターン認識/第5章 情報検索とベイズ決定/第6章 線型回帰モデルのベイズ推定/第7章 ベイズ更新とカルマン・フィルター/第8章 医学とベイズ決定/第9章 医薬とベイズ統計学/第10章 信頼性とベイズ統計学/第11章 イメージ・プロセシングとベイズ推定/第12章 ベイジアン・ネットワーク入門
著者は統計数理研究所(統数研)からこの世界に入り、筑波大学、東京大学などで教鞭をとられました。確率・統計のハードな基礎理論だけでなく、数理計画法、人工知能、データサイエンス界隈でも活躍し、数理科学分野への応用に強い研究者という印象があります。現在は(株)ベイズ総合研究所の代表取締役として活躍中とのことです(ホームページ「松原望の総合案内サイト」)。
まえがき/本書を有効利用するための情報
第1 章 ベイズの定理
トーマス・ベイズとベイジアン/ベイズの定理とその証明/原因の確率/主観確率の役割/確率の更新/多数の原因/事後分布/事前分布
第2 章 ベイズ決定の基礎
ベイズ決定/多次元のベイズ決定
第3 章 社会的リスクと決定
リスク認知とベイズの定理/安全性のモデル/確信の形成のようす/決定の正しさと到達時間
第4 章 ベイズ判別問題とパターン認識
メッセージと符号/ベイズ決定/正規分布をもつノイズ/ミニマックス決定/パターン認識と分類/ベイズ決定による判別(分類)/判別分析
第5 章 情報検索とベイズ決定
分類子と関連性/文献からのサンプリング/ベイズ検索/ロジット分析
第6 章 線型回帰モデルのベイズ推定
正規線型モデル/回帰分析/ベイズ回帰モデル/階層モデル
第7 章 ベイズ更新とカルマン・フィルター
リアル・タイム推定/カルマン・フィルターのモデル/カルマン・フィルターの漸化式/シミュレーション例
第8 章 医学とベイズ決定
医学的意思決定/検査による診断/ベイズの定理による取り扱い/確率的情報処理における更新/疾病名のベイズ診断:ケーススタディー
第9 章 医薬とベイズ統計学
比較の確率/確率θのベイズ推定/予測分布の効用
第10 章 信頼性とベイズ統計学
信頼性と確率論/信頼性のベイズ統計学的取り扱い/経験的ベイズ決定
第11 章 イメージ・プロセシングとベイズ推定
イメージ・プロセシング/点拡がり関数の考え方/ジーマン-ジーマンによる画像処理モデル
第12 章 ベイジアン・ネットワーク入門
確率のエンコーディングと確信計算/有向グラフとマルコフ性/有向分離とエンコーディング
参考文献/索引
2-4 D.V. リンドレー『確率統計入門 1. 確率: ベイズの方法による』
現在、国立国会図書館(NDL)の個人送信サービスで閲覧できるベイズ統計学の関連書籍は、少ないながらも入門的な専門書が数冊あります。ここで紹介するのは、マグレイン『異端の統計学 ベイズ』にも登場する「ベイズを体系化し哲学とした三人」のひとり、デニス・V・リンドレーによる入門書で、ベイズ統計学を公理論的に展開したものです。といっても、豊富な例題と各章末に掲げられたかなりの数の練習問題があり、具体的かつ実践的です。ここで紹介する第1巻は確率論です。
▶ D.V. リンドレー『確率統計入門 1.確率: ベイズの方法による』、培風館(1968)、pp.244
その際、コルモゴロフ流の絶対確率ではなく、ベイズへの移行を念頭において、レニー流(レーニとも書かれる)の条件付確率の公理系から出発します。そして、この公理系のもとに、ベイズの定理が示されます。要所要所で、頻度主義統計学の手法が参照・比較されますが、第1章の終盤では、早くも「確信の度合(degrees of belief)」という概念が導入されてベイズの定理が再解釈され、事前確率や事後確率の概念が基礎づけられます。筆頭訳者は、あの竹内啓。この人は、フィッシャー『統計的方法と科学的推論』の訳者で、巻末の「訳者あとがきにかえて」には、本書の意義と、ワルドらの統計的決定理論との関係が示されます。

▶ D.V. リンドレー『確率統計入門 1.確率: ベイズの方法による』、培風館(1968)
つぎのバナーから入ります(PC、タブレット推奨)。未登録ならば「本登録」に進みましょう。詳細、《当サイトの案内記事》参照。

- 確率
序/頻度極限の概念/確率の公理/独立性/ベイズの定理/遺伝学への応用/確信の度合/練習問題 - 確率分布:1変数の場合
離散型の場合/連続型の場合/ポアソン過程/分布の特性値/単純ランダムウォーク/母関数/練習問題 - 確率分布一多変数の場合
離散型の場合/連続型の場合/確率変数の1次関数/確率変数の関数の平均および分散の近似値/変数変換/極限定理/練習問題 - 確率過程
転入:転出過程/単純待ち行列過程/到着がポアソン分布、サービス時間が一般の分布の行列過程/更新理論/マルコフ連鎖/マルコフ連鎖(続き)/練習問題
文献/訳者あとがきにかえて/索引/記号表
2-5 D.V. リンドレー『確率統計入門 2. 統計的推測: ベイズの方法による』
デニス・V・リンドレーによるベイズ流の確率統計学の入門書、その第2巻は統計的推論です。ここでは、統計的推論と統計的意思決定が峻別されて、後者は議論されません。
▶ D.V. リンドレー『確率統計入門 2.統計的推測: ベイズの方法による』、培風館(1969)、pp.282
大学の確率統計の教科書として書かれた本書、しかも、著者はベイズ再興の立て役者、リンドレーですから、ベイズ流で押し通すことが期待されています。一般のベイズ統計学では現れない正規分布に関連した推定問題などをどう扱うか? そこで、登場させるのが「ベイジアン」なる用語。ベイズ主義者ではありません。この教科書では、ベイズの定理を繰り返し使用することを基盤とする手法をベイジアンとよぶのです。そして、正規分布における推定問題でも、ベイジアンアプローチによって、事前の確信の度合が、事後の確信の度合にどのようにして移り変わるのかを議論していきます。巻末の「訳者あとがき」も必見です。

▶ D.V. リンドレー『確率統計入門 2.統計的推測: ベイズの方法による』、培風館(1969)、pp.282
つぎのバナーから入ります(PC、タブレット推奨)。未登録ならば「本登録」に進みましょう。詳細、《当サイトの案内記事》参照。

- 正規分布に関する推測
ベイズの定理と正規分布/ばくぜんとした事前の知識と正規分布の平均に関する区間推定/正規分布の分散の区間推定/正規分布の平均および分散に関する区間推定/十分性/有意性検定と尤度原理/練習問題 - いくつかの正規分布に関する推測
二つの平均の比較/二つの分散の比較/二つの平均に関する一般的な比較/いくつかの平均の比較/分散分析/観測値の結合/練習問題 - 近似的方法
最尤法/試行の無作為系列/ポアソン分布/適合度検定/適合度検定(続き)/分割表/練習問題 - 最小2乗法
分散均一の線型正規回帰/相関係数/線型仮説/数值計算法/二元分類/線型仮説理論のさらに進んだ応用/練習問題
付録 \(\chi^2\)-分布における両側パーセント点/文献/訳者あとがき/索引/記号表
3.正当派統計学(頻度主義統計学)を知る
私、探訪堂は、統計学の学徒ではなく、この方面の学究にはお世話になりっぱなしで、たとえば、学生時代、インターンシップで派遣された工場で、ある製造ラインの品質管理改善をテーマに、フィッシャーの「実験計画法」を使った実験計画、データ収集、結論解析、検証実験などを体験させていただき、その威力に恐れおののくばかりの素人で、上司に対して「どんなもんじゃ!」と自信をもって言えない訳です。その後は、ベイズ更新公式の威力を実地に確認する機会があったりと、僅かながらも経験を重ねましたが、思想・信条はともあれ、ベイズ主義も頻度主義も、応用分野ごとに棲み分けがなされているという感覚です。マグレイン『異端の統計学 ベイズ』を読むと正当派統計学の連戦連敗のような感覚をもちますが、この頻度主義統計学の手法、データサイエンスの時代に対応すべく、装いも新たに蘇りつつあるようです。
3-1 北川敏男、稲葉三男『基礎数学: 統計学通論』、共立出版
確率・統計といえば、私、探訪堂にとっては、北川敏男(1909-1993)なのです。バリバリのフィッシャー流統計学の継承者ですが、ベイズ統計学のサヴェッジ派対ジェフリーズ派の対立(マグレイン『異端の統計学 ベイズ』、p.397など)を乗り越えようとした人でもあり、また、戦後日本のサイバネティックス運動を主導した研究者のひとりです。ノーバート・ウィナーだけでなく、ロナルド・フィッシャーとも面識があり、ウィーナーのサイバネティックスを超える情報学の構築を目指した、北川流情報学の開祖でもあります。日本語の「情報学」ということばの生みの親ですね。当サイトでも、関連記事を取り上げています。ぜひ、ご覧下さい。
≫ 【書評記事】 第7話 北川敏男編『サイバネティックス』を読み解く
≫ 【書評記事】 第8話 北川敏男編『續サイバネティックス』を読み解く
さて、統計学のテキスト、名著です。
▶ 北川敏男、稲葉三男『基礎数学 統計学通論 第2版』、共立出版(1960)、pp.226
1960年に初版が刊行されたこの本、1960年から1978年までに160刷を重ねた統計学の標準的教科書でした。そして、1979年に出た第2版も、国立国会図書館の個人送信サービスで読めるようになりました。頻度主義統計学の全体像を、豊富な例題を通じて把握できます。巻末の付章には、統計学の歴史が簡潔に要約されていて、最後の第4節「現代統計学」では、統計的決定関数論や推測過程論などがすこしだけ紹介されています。

▶ 北川敏男、稲葉三男『基礎数学 統計学通論 第2版』、共立出版(1960)、pp.226
つぎのバナーから入ります(PC、タブレット推奨)。未登録ならば「本登録」に進みましょう。詳細、《当サイトの案内記事》参照。

第1章 資料の整理
度数分布表/度数分布図/代表値/散布度/相関係数/回帰直線/相関表/共同研究
第2章 確率
確率、事象/組合せ論による確率計算/確率に関する基礎定理/確率の経験的意味/共同研究
第3章 確率分布
二項分布/離散型確率分布(1次元)/離散型確率分布(多次元)/一様分布/正規分布/連続型確率分布
第4章 標本分布
無作為抽出/標本分布/カイ二乗分布/F分布、t分布/共同研究
第5章 推定
推定の基礎/最尤推定/区間推定/共同研究
第6章 検定
統計的仮説検定/分布型の適合度検定I/分布型の適合度検定II/独立性の検定/平均値の検定/平均値の差の検定/分散の検定/相関係数の検定
付章 統計学の発達
古典統計学以前/古典統計学/近代統計学/現代統計学
補注/参考書/問題解答/付表/付録 正規確率紙/索引
3-2 スピーゲル『統計(マグロウヒル大学演習シリーズ)』
マグロウヒルの大学演習シリーズといえば、やや大振り、B5判(182x257mm)のソフトカバー本で、各章ごとに内容の要約があり、それに解答付きの演習問題が続き、章末に補充問題があるという構成です。このシリーズ、マグロウヒル好学社版とオーム社版がありますが、すでに絶版となった前者から18冊ほど、国立国会図書館の個人送信サービスで閲覧できるというので驚きです。ここでは、
▶ M.R. スピーゲル『統計』、マグロウヒル大学演習シリーズ、マグロウヒル好学社(1981)、pp.229
を紹介しましょう。中身は、正当派の統計学で、フィッシャー流の頻度主義統計学の流儀にのっとり、細かく、丁寧、しかも、満遍なく良質な問題が取り上げられています。簡略ながら、補充問題の解答の掲載されていて、実力養成にはもってこいです。

▶ M.R. スピーゲル『統計』、マグロウヒル大学演習シリーズ、マグロウヒル好学社(1981)、pp.229
つぎのバナーから入ります(PC、タブレット推奨)。未登録ならば「本登録」に進みましょう。詳細、《当サイトの案内記事》参照。

訳者序文/字文
第1章 標本理論
母集団と標本、統計的推論/復元抽出と非復元抽出/任意標本、乱数/母数/標本/統計量/標本分布/標本平均/平均の標本分布/比率の標本分布/差と和の標本分布/標本分散/分散の標本分布/母分散が未知の場合/分散の比の標本分布/他の統計量/度数分布/相対度数分布と累積分布曲線図/分類されたデータの平均、分散と積率の計算
第2章 推定理論
不偏推定値と有効推定値/点推定値と区間推定値、信額性/母数の信賴区間推定值/平均の倍頼区間/比率の倍頼区間/差と和の信類区間/分散の信頼区間/分散の比の信頼区間/最尤推定値
第3章 仮説検定と有意性検定
統計的決定/統計的仮說、帰無仮説/仮説検定と有意性検定/第1種と第2種の誤り/有意水準/正規分布を必要とする検定/片側檢定と両側検定/大標本の場合の特別な有意性検定/小標本の場合の特別な有意性検定/推定理論と仮説検定の関係/動作特性曲線、検出力/品質管理図/標本度数分布への理論分布のあてはめ/適合度に対するカイ2乗検定/分割表/連続性のためのイェーツの補正/分割の係数
第4章 曲線のあてはめ、回帰と相関
曲線のあてはめ/回帰/最小2乗法/最小2乗直線/標本分散と標本分散で表わした最小2乗直線/最小2乗放物線/重回帰/推定値の標準誤差/線形相関係数/一般的相関係数/順位相関/回帰の確率的解积/相関の確率的解釈/回帰の標本理論/相関の標本理論/相関と従属
第5章 分散分析
分散分析の目的/1元配置法あるいは1因子実験/全変動、処理内変動、処理間変動/変動を求める簡略法/分散分析のための線形数学モデル/変動の期待値/変動の分布/等平均の帰無仮説に対するF検定/分散分析表/観測数が等しくない場合のための修正/2元配置法あるいは2因子実験/2因子実験のための用語/2因子実験に対する変動/2元配置の分散分析/反復のある2因子実験/実験計画
付録A 数学の公式 /付録B zにおける標準正規曲線の縦座標(y) /付録C 0からzの標準正規曲線下の面積 /付録D 自由度 \(\nu\) のスチューデントのt分布に対するパーセント点、(\(t_p\)) /付録E 自由度 \(\nu\) のカイー2乗分布に対するパーセント点、(\(\chi^2_\rho\)) /付録F 分子の自由度 \(\nu_1\)、分母の自由度 \(\nu_2\) のF分布に対する95%点(水準0.05),\(F_{\cdot 95}\) と99%点(水準0.01)、\(F_{\cdot 99}\) /付録G 4桁の常用対数/付録H \(e^{-\lambda}\) の値 /付録I 乱数
補充問題の答/索引
3-3 北川敏男『推測過程論』
共立出版の「情報科学講座(全65巻)」は歴史に残る専門書群で、現在では、その多くを国立国会図書館の個人送信サービスで閲覧できます。研究者向けの書籍で遠慮も容赦もありません。今回は、本稿のタイトル本、マグレイン『異端の統計学 ベイズ』に関連して、1冊だけ紹介しましょう。それは、情報科学講座の共通基礎理論(A)の統計理論(A・5)、その第5巻で、北川敏男が知識情報システムの構築をめざして進めてきた厳密な数理統計学から、物理学に対峙する学問体系としての北川情報学への橋渡し、すなわち、統計学に基づく推測過程論から統計情報学への径が示されており、また、統計学のサイバネティックス的形式化などという概念も紹介されていています。
▶ 北川敏男『推測過程論』、共立出版、情報科学講座 A・5・5(1984)、pp.356
近代数理統計学は、データの特徴を説明するという記述統計学と、限定されたデータから全体の特徴を推定するという推測統計学に分類されていて、本書は、1920年代以降に、フィッシャー、ネイマン、ワルドらによって構築されてきた推測統計学の基本事項と、推測統計学に対する筆者自身の思想をまとめたものです。
既存知識の利用を前提とするベイズ学派に対して、『異端の統計学 ベイズ』にも頻繁に登場する反ベイズ派の大物指導者、イェジ・ネイマン(1894-1981)は、ベイジアンが想定した事前分布の僅かな変化によって、推定したい値が大きく変動する現象を指摘します。そのような指摘を起点として、ワルドの統計的選択関数論が登場するのですが、ベイズ流の推測過程における難所を乗り越える北川流のアプローチも示されます。読みごたえ十分の序章と終章を除き、他の章の本文は、ほぼ数式で埋め尽くされていますが、各章の “はじめに” と “おわりに” には、研究者の動向や主題の展望などが与えられます。

▶ 北川敏男『推測過程論』、共立出版、情報科学講座 A・5・5(1984)、pp.356
つぎのバナーから入ります(PC、タブレット推奨)。未登録ならば「本登録」に進みましょう。詳細、《当サイトの案内記事》参照。

序章 基盤と行程
推測過程論への動機/九州大学およびその周辺における協力/国際交流による研究/本巻の構成と記述/続巻「統計情報論」への接続
第1章 多標本論
はじめに/正規分布に関する二標本論(例示)/二標本論の一般的様相/三標本論の形式化/有限母集団における統計的推測への二標本論の応用/2標本における推定量の相対効率/まとめ:結びとつながり
第2章 TE型推測過程:予備的な有意性検定ののちの推定
はじめに/TE手続きとしての随時併合/相互貫入標本法/逐次併合法/直交関数系あてはめの逐次TE過程/まとめ:結びとつながり
第3章 基本的な推測過程の射程(TEおよびTT)
まえがき/TE型推測過程の性能保持に関する諸勧告/既存知識の利用と推測過程/混種推定/TT型推測過程/TE型推測過程への危険論的批判/仮説検定と推測過程におけるその意義/分散分析法と基本的推測過程/まとめ:結びとつながり
第4章 回帰解析と推測過程
はじめに/線形回帰解析における \( T^nE \) 型 (n≧1) 推測過程/不完全模型における線形回帰係数の偏りのある推定/予備的有意性検定ののちの推定/2段階逐次実験計画/3段階逐次実験計画/2次元における回転可能計画に関連する模型における予備的有意性検定ののちの推定/2次元の反応曲面解析に関する2段階逐次実験計画の例/2次元の反応曲面解析に関する3段階逐次実験計画の例/予備的有意性検定ののちの推定に関連する事象の確率と確率変数の平均値の計算/回帰解析における不完全規定模型/推測過程と多重決定問題/まとめ:結びとつながり(線形回帰論における推測過程論の射程)
第5章 標本調査系列の計画過程
はじめに/多目標の標本調査/標本調査系列の計画過程への道標/標本調査設計と配分相対効率の増進/層化問題と調査資源均分原理/標本調査系列の計画過程/標本調査論への推測過程論の応用/まとめ―結びとつながり
第6章 推測過程論の発展動向
はしがき/研究動向把握の方法論/研究者集団の摘出/研究対象集団分類のための視軸および視察空間/原著論文リストの整理/引用関係の利用/keywords集団の利用/母集団規定問題/引用文献系譜図の方法:結びにかえて
終章 総括と展望
推測過程論の論理/推測過程論における検定論の再建/推測過程論の課題:「統計情報論」および別著への接続
文献/索引
4.統計学者を知る
近代統計学がいったい誰から始まるかについては、多くの見解があるようですが、ニュートン=ラプラスの決定論的な世界像とは相容れない本質的に確率的な現象の重要性を見いだした研究者として、英国の数学者カール・ピアソン(1857-1936)と、米国の物理学者ジョサイア・ウィラード・ギブス(1839-1903)をあげてもそう異論はないと思われます。ギブスは統計物理学者ですから、統計学の専門家はカール・ピアソンから始まることになるようです。純粋数学と応用数学、応用数学と数理科学の狭間で板挟みになりながら、あくまでも科学としての統計学を追求した研究者もいれば、社会学、経済学、経営学、工学との境界領域の開拓に生涯をかけた研究者もいるという具合で、統計学者のことを調べるのは楽しい作業です。情報学の存在しない時代に、一気に情報科学を作り上げたクロード・シャノンのような研究者がいないぶん、錯綜し、込み入っていて、探訪するにはうってつけのテーマです。
4-1 サルツブルグ『統計学を拓いた異才たち』
ロナルド・フィッシャーの歴史的な一冊『実験計画法』は、残念ながら、現在でもオンラインでは読むことができないけれど、かつて図書館で借りて読んだことがあります。
そのなかの “貴婦人と紅茶” の話しには、同じミルクティでも、紅茶にミルクを注いだものと、ミルクに紅茶を注いだものを味わい分けられるという御婦人が登場します。そこで、彼女の能力を確認するための方法を提案することになります。ミルクと紅茶の混ざり具合、ミルクティの温度、出す順番等々、考慮すべき要因が多々ありますが、さて、フィッシャーはどのような実験を提案したのでしょうか。当のフィッシャーの『実験計画法』にも、この実験の顛末は語られていませんが、その場に居合わせたという研究者から詳しい話しを聞いていた人物がいます。米国ファイザー社、中央研究所の上級研究員で、長年、統計解析に携わってきた研究者、デイヴィッド・サルツブルグ(1931-)です。そのサルツブルグの4冊目の著書が、まさに
- 『紅茶を味わう貴婦人:統計学はいかにして20世紀の科学に革命をもたらしたか(The Lady Tasting Tea: How Statistics Revolutionized Science in the Twentieth Century』、Henry Holt and Company(2002))
という題名で、第1章でこの話題が取り上げられています。我が国では、2006年に、つぎのタイトルで全訳され出版されました(残念ながら、現在、その後出版された文庫本も、品切れ再版予定無しです)。
▶ デイヴィッド・サルツブルグ『統計学を拓いた異才たち:経験則から科学へ進展した一世紀 』、日本経済新聞社(2006)、pp.437
本書は、現代統計学の歴史を繙きながら、科学や産業との係わりを熱く語った一般向けの本で、全部で28章に分かれており、そこには130名を超える研究者が登場します。「日本語版への序文」には角谷静夫や北川敏男も登場して、関孝和以来の日本数学の伝統が語られます。マグレイン『異端の統計学 ベイズ』に登場する人物はもちろんのこと、ロバスト性研究のジョージ・ボックス、「安かろう、悪かろう」の日本製品の品質をわずか2年で劇的に変革した日本科学技術連盟主導の品質管理活動に多大な影響を与えたエドワーズ・デミングが登場します。公共図書館でも読むことはできますが、ぜひ再版してほしい一冊です。
4-2 北川敏男『統計科学の三十年: わが師わが友』
日本統計学の大御所で、北川流情報科学の開祖が、自らの還暦を迎えるにあたって、統計学界・科学界の巨人たちとの交流から得た体験をもとに、「これら学者たちの肖像を、多くの人たちのために、何とか語り伝え、書きのこしておきたい」と願って書かれた本、それを紹介しましょう。
▶ 北川敏男『統計科学の三十年: わが師わが友』、共立出版(1969)、pp.212
この本は、当サイトの書評記事
でも少し紹介しましたが、北川敏男が、自身が師事したり、あるいは交流をもった統計学の研究者たちを語りつくします。主な登場人物は
- P.C. マハラノビス(多変量解析のマハラノビス距離)
- R.A. フィッシャー(近代統計学の祖)
- S. ウィルクス(多変量統計解析)
- J. テューキー(データ解析学)
- N. ウィーナー(サイバネティックス)
- R. ベルマン(動的計画法)
- G. ボックス(EVOP開発と適応制御系)
- 北川敏男(最終章「わが歩み」)
です。かなり貴重な資料です。制御理論のベルマンとボックスが登場しますが、北川の『推測過程論』から『制御過程論』への歩みの発端が理解できる記録になっています。

4-3 リード『数理統計学者 イエルジイ・ネイマンの生涯』
近代統計学の超大物、イェジ・ネイマン(1894-1981)の評伝を国立国会図書館の個人送信サービスで読むことができます。コンスタンス・リード(1918-2010)、1982年の作品、
▶ コンスタンス・リード『イエルジイ・ネイマンの生涯』、現代数学社(1985)、pp.525
です。525ページという圧倒的な分量ですが、1894年の誕生から1979年の85歳の誕生日までを数年づつに区切り、文献や関係者へのインタビューを重ねながら読みやすい物語に仕上がっています。近代統計学史に登場する様々な人物が活写されていて、読みごたえ十分です。
本書は、ネイマン=ピアソンの仮説検定公式を発展させて、仮説検定に関する教科書の決定版を書いたエリック・レーマン(1917-2009;本書ではエリッヒ・レーマンと訳されている)に、ネイマンの伝記を書いてみないかと示唆されて書き始めたとのことです。もう一方の雄、ロナルド・フィッシャーには、ジョージ・ボックスと結婚した次女、ジョアン・フィッシャー・ボックスによる評伝があります(原著英語版のみ)。
本書『イエルジイ・ネイマンの生涯』は、レーマン自身とその妻の援助・友情を享けて書かれていますが、あくまでリードの視点による評伝を目指しています:
当初,現に生存し,今もなお非常に積極的に活動しているネイマンのような人物について書こうとしたとき、85年間にわたる彼の回想と記録、それと彼についての私の個人的観察だけに限定しようと計画した。しかし、やがて私は彼の同僚やかつての学生たちの回想も加えて,これらを補う必要性を感じるようになった。(リード『イエルジイ・ネイマンの生涯』)
登場人物は多彩です。カール・ピアソンをはじめ、エミール・ボレル、アンリー・ルベッグも登場します。フィッシャー教授との対決は、本書の山場のひとつになっています。

▶ コンスタンス・リード『イエルジイ・ネイマンの生涯』、現代数学社(1985)、pp.525
つぎのバナーから入ります(PC、タブレット推奨)。未登録ならば「本登録」に進みましょう。詳細、《当サイトの案内記事》参照。

コンスタンス・リードについては、当サイト『理系書探訪』に、彼女の初期の大作『ヒルベルト: 現代数学の巨峰』の紹介記事があります。
5.書斎の本棚/図書館の書棚から
ここでは、マグレイン『異端の統計学 ベイズ』に関連した本をさらに紹介します。
5-1 マグレイン『お母さん、ノーベル賞をもらう』
『異端の統計学 ベイズ』の著者、マグレインの2冊目の著書
▶ シャロン・バーチュ・マグレイン『お母さん、ノーベル賞をもらう: 科学を愛した14人の素敵な生き方』、工作舎(1996)、pp.524
を紹介しましょう。工作舎には「素敵な女性たちの心をこめた仕事」というシリーズがあり、『科学史から消された女性たち』や、アインシュタインの最初の妻、ミレヴァの伝記、『二人のアインシュタイン』などがあります。女性のノーベル賞受賞者だけでなく、ノーベル賞級の業績をあげた女性研究者の生涯にせまっています。主人公14名は、つぎの人たちです。
マリー・スクロドフスカ・キュリー / リーゼ・マイトナー / エミー・ネーター / ガーティ・ラドニッツ・コリ / イレーヌ・ジョリオ=キュリー / バーバラ・マクリントック / マリア・ゲッペルト・メイヤー / リタ・レヴィー=モンタルチニ / ドロシー・クロフォート・ホジキン / 呉健雄 / ガートルード・ベル・エリオン / ロザリンド・エルシー・フランクリン / ロザリン・スッスマン・ヤーロウ / ジョスリン・ベル・バーネル
個人的には、エミー・ネーター(1882-1935)が印象的でした。変分法、特に解析力学への応用において重要かつ特異な役割を果たす「ネーターの定理」で有名な数学者ですが、アインシュタインの相対性理論の構築に、直接かつ深く係わっています。ドイツにおいて、女性研究者の地位が確立するはるか前の物語で、女性が大学で授業を受けることすら困難な時代に、エルランゲン大学で代数幾何学の教授であった父の計らいで、かろうじて聴講生として数学を学び始めます。やがて、ヒルベルトの助手としてならば、講義をもってよいという教授会の許可がでて、無給講師としての生活が始まります。教授会へ投げかけたヒルベルトの怒りの言葉「理事会は銭湯じゃないんだ」は本書にも登場します。コンスタンス・リード『ヒルベルト: 現代数学の巨峰』にも、ネーターが頻繁に登場しますが、彼女だけに焦点を合わせた記事として興味深く拝読しました。ほかには、1986年の生理学・医学賞受賞者のリタ・レヴィー=モンタルチニ(1909-2012)しょうか。この人には、回想録『美しき未完成: ノーベル賞女性科学者の回想』がありますが、本書の第8章は、マグレインが書くとこうなるんです、という迫力の文章です。ただ、本書、残念ながら品切れ再版予定無しに分類されています。
5-2 岩崎 学『事例で学ぶ! あたらしいデータサイエンスの教科書』
近ごろは、理系、文系を問わず、データサイエンスが社会人基礎力の一端に組み込まれて必須事項になっており、一昔前の「パソコン・スキル」と同じ事態です。つまり、機械学習とかデータマイニングとか言っても、内容がややこしければ、結局、個別に解法や前処理法を探るしかないわけで、そのためにもデータ解析の具体的な内容を身に付けることが求められているのです。まさに AI の時代ですね。
データサイエンスは、情報科学と統計学に基礎づけられた方法論を駆使して、データから有意義な知識や見識を導き出すアプローチ全般を意味する用語として定着しているようです。ひところの「システム科学」や「システム工学」と同様、それ自身が “具体的な中身” をもっているわけではなく、そのため、当面する問題状況に関する専門知識や経験は、どうしても必要です。まさに、“中身をもたない一般と意味をもたない特殊” のはざま位置する学問体系なのです。
新刊書店に行くと、数学と物理のコーナーのあとで必ずチェックするのが、データサイエンスの書棚です。大部のものが多い中で、その日、私、探訪堂の目に入ったのが
▶ 岩崎 学『事例で学ぶ! あたらしいデータサイエンスの教科書』、翔泳社(2019)、pp.260
です。
著者、岩崎 学氏は、日本統計学会の会長も務めた大御所です。内閣府、総務省をはじめとする各機関の専門委員を歴任した研究者で、『統計的因果推論』などの専門書で知られています。そんな著者が、初学者のために書き下ろした教科書だったようです。データサイエンスの概要を要約したのち、統計的推測の基礎の基礎から説き始め、単回帰分析、重回帰分析、統計的検定、階層データモデル、実験計画法等々、基本的な解析テクニックをデータサイエンスの実際の状況に、どのように使っていくかが丁寧に述べられます。統計的因果推論の話しは第4章です。残念ながら、練習問題や章末演習、綜合演習課題などが含まれていないため、理解を確認したり、深めたりといった学習のためには、別途、演習書が必要なようです。
第1章 データサイエンスとは
これまでの統計的データ解析の流れ/データサイエンスの特徴
第2章 アンケート調査結果から何を読み取るか
データの要約統計量の導出とグラフ化/1変量データの要約とグラフ化/2変量データの要約とグラフ化/統計手法の概説(統計的推測の基礎)
第3章 オープンデータから何がわかるか、何がいえるか
データの素性と分析結果の解釈/集計データ分析のための論点/問題の定式化とパラメータの推定/統計手法の概説(単回帰分析とエコロジカル・インファレンス)
第4章 Webコンテンツの更新は売上高に効果があるか
データの吟味と分析の目的/データ分析の基本的事項/データの分析と解釈/統計手法の概要(重回帰分析)
第5章 ダイエットは効果があったのか
データの集計および単純な解析/処置前後データ解析の論点/スクリーニング下での統計的推測/統計手法の概説(統計的検定)
第6章 テストの結果について部分と全体を融合する
階層的なデータ構造/マルチレベルモデルとマルチレベル分析/計算例とその解釈/統計手法の概説(階層データのモデル)
第7章 寿命をいかに測り分析するか
寿命データの特徴/打ち切りとトランケーションの下での推定/推定値の計算法/統計手法の概説(寿命データの解析)
第8章 おいしいカフェオレを作りたい
測定の精度の計算/おいしいカフェオレを作る/実験計画法とデータの分析法の基本/統計手法の概説(計画の直交性と直交表)
第9章 あるべきデータがない
欠測値への対処法とその性質/欠測データの統計処理の基本/欠測への対処法とその結果/統計手法の概説(欠測のモデルと多重代入法)
第10章 機械学習のエッセンス
データ分析のおさらい/機械学習手法の分類/パフォーマンスの評価