2019年2月4日月曜日

出:モデルとなるべき本






データ解析のための統計モデリング入門──一般化線形モデル・階層ベイズモデル・MCMC』(久保拓弥、岩波書店)

わかりやすいことこの上ない。
読みながら何度も「わかる!」と叫ぶ。
これには、理解しやすいという意味と、「共感」の意味がある。
「そうそう、なんでも正規分布に従うわけじゃないよね」とかそういう「わかる」だ。
モデルを、データへの当てはまりの良さだけでなく予測の良さを加味して選ぶ、
というあたり、「それそれ!」という感じだ。

あとがきによれば、時間をかけて何度も書き直したらしいが、
そのエネルギーのほとんどが「わかりやすさ」に向かったと想像する。
よーく練り込まれているな、練り込まれた結果としてわかりやすい文章に
なっているな、というのが読んでいていよーくわかる。

タイトルには「どんな虫ケラでもわかる」などとうたっていながら、
実際のところはただ情報を端折っただけでちっともわかりやすくない、
あまり練られていない本も多い。
しかし、この本はこれだけ小難しそうなタイトルでありながら、
ちゃんとわかる。
タイトルにある一般化線形モデル、階層ベイズモデル、MCMCというのが
なんなのか、ということが、章が進むごとにわかっていく。
植物の種の数という、単純なデータを解析しながら、
だんだんと複雑なモデリングを行っていき、そのたびに新たな手法を取り入れる。
なかなかのスピード感、疾走感だ。

これにはひとつからくりがあって、
難しい理屈はすべて「章末の参考文献を参照」となっているのだ。
この割り切り、この潔さが成功している。
どこまで説明すればいいのか、という判断が絶妙で、
眠くなる前にズンズン進んでくれる。
これからデータ解析を始めようという人には
大変ありがたい。
その後、もっと学びたかったら参考文献を読めばよい。
この著者が薦めるのだから、間違いないだろう。

統計モデリングのやり方はもちろん、
本の書き方についても勉強になった。

最後に注意点。
わかりやすいといっても、もちろん誰が読んでもわかるというものではない。
高校数学や確率統計の知識は前提となる。
「回帰分析」という言葉にピンと来ないならば、
ちょっと調べてから読んだほうがいいだろう。

読了指数
音階:+1
合計:-116