統計

【読んでみた】この世で一番おもしろい統計学

投稿日:2019年10月11日 更新日:

てん@統計家さんです

この世で一番おもしろい統計学」という本を読んでみました。

大変楽しく読ませていただきましたので、感心した点を紹介したいと思います。

本書の特徴

巻末で訳者が以下のように述べています

まず、大枠での考え方をつかもう。本書はそれだけに特化する。標本を元にどう信頼区間が設定できるのか、そしてそれをもとにどう仮説検定が行われるか――統計学の根底はそこにある。だからまずはそこだけをじっくり、くどく、しつこく押さえよう。
このかなり大胆で思い切った絞り方にこそ、本書の最大の特徴がある。(中略)数式1つ、説明1行ですませるところを、5ページかけるところが本書のよさなのだ。

まさにそのとおり、マンガ仕立てにさえすれば「この世で一番おもしろく」なるか?と言われるとそうではないと思います。実際、かなりの数の「統計入門マンガ」を読んできましたが、あくまでそれらは統計入門講義の紙芝居+主人公とその職場の物語であって「この世で一番おもしろい」講義にはなっていません。しかし、この本は統計学の根底をくどく、しつこく、大胆に絞り込んで紹介しています。それが故に過去に例のない「世界で一番おもしろい統計学」の本になっているわけです。

要約

本書の内容の要約も訳者コメントでほとんど済んでいます。

  1. 全体を知ることは難しい
  2. 標本なら取れるはず
  3. 標本を集めるってどういうこと?
  4. 標本から全体に対して言い切れることがある(その裏にあるややこしい理論は統計家の奴らに任せておこう)
  5. これらは統計学のどの手法にも共通する根底となる考え方だ
  6. この先に進むものはすべての希望を捨てよ

これだけです。これだけですが、非常に重要なことが丁寧に書かれています。

たとえば、入門書定番の「多くのデータは正規分布に従っている、正規分布に従っているデータは・・・」というような話は一切出てきません。正規分布はあくまで「平均はなぜか釣り鐘型になるんだよ(統計家が小難しい方法で証明しているから安心して)」という文脈でしか出てきません。

avatar

てん

何度も言っていますが「正規分布に従うデータ」なんてありません!

この本をおすすめしたい方

いわゆる「入門書」という位置づけで紹介されていることが多いようですが、おそらく正しくありません。統計を勉強したいときの最初の一冊にこの本を手に取ることが適切かと言われるとかなり疑問があります。従来の入門書はそれはそれでよく練られた展開での解説がなされており、最初の一冊にはそういった本のほうが適切だと思います。

この本の正しい位置づけは「統計入門書で挫折した方」「統計入門書でわかったつもりになっている方(より高度な書籍に進みたい方)」向けです。私自身、新しい知識こそ多くは得られませんでしたが、頭の中の理解をよく交通整理できました。

統計入門書で挫折した方 へのおすすめポイント

全くと言っていいほど数式は出てきません。

「数式が出てこない」を謳う入門書あるあるである結局後半は数式だらけ問題も起こしていません。最初から最後待って一貫して数式が出てこない、ないし出てきても無視して問題ない構成になっています。数式アレルギーで挫折した方でも読み進められると思います。

ユーモアの入り方が秀逸です。

マンガ入門書では大抵クスっと笑えるポイントが用意されていますが、そのほとんどは統計学の解説と無関係なポイントで主人公とその雇い主(店長)や上司がボケているだけだったりします。この本におけるユーモアは統計と無関係なものではありません、その章で説明したいことを繰り返し何度も何度も表現を変えて説明するための、それでいて退屈にならないしつこくならないためのユーモアになっています。ユーモア一つ一つその裏側にある伝えたいメッセージを読み解く!そんな難しいことを考えながら読んで頂く必要はないのですが、この本のユーモアで笑っている時間は統計の勉強における休憩時間ではなく、まさに統計を理解するための時間である。ということはこの本の非常に素晴らしい点です。

統計入門書でわかったつもりになっている方 へのおすすめポイント

統計ってなんだ?という根底を整理して理解することが出来ます。

統計入門書は多くの場合、手元にあるデータをどうまとめるか(分析するか)に焦点があたっています。そのため、統計学の根底である標本から全体に対して何が言えるかを考えるという重要な視点はほとんど触れられないことが多いです。ある意味「そこは共通認識だよね?」と放置されているわけです。
しかしこの本は、徹底して「標本から全体に対して何が言えるかを考える」だけを取り扱います。

確かに統計入門書を片手に、手元のデータを分析してそれっぽいレポートを作ることは可能なのですが、「標本から全体に対して何が言えるかを考える」ことが出来ていないと、様々な落とし穴にハマってしまいます。つまり、言い過ぎをしてしまうわけです。

加えて、統計学の根底をしっかり押さえることで、新しく手法を学ぶときの土台がしっかりします。「このデータはどうやって分析したらいいのかな?」という視点で手法を学ぶときは、毎回イチから勉強するようなものです。しかし統計学の根底・土台がしっかりしていれば、どんな手法を勉強するときも土台に乗せる作業だけです。

統計学の勉強の仕方がわかります。

この本の要約としてこの先に進むものはすべての希望を捨てよと書きましたが、この本ではしっかりその先の道の進み方を記載しています。つまり、

  • 分析の目的が変われば(例えば、平均ではなくばらつきに興味がある場合など)標本のまとめ方とその分布が変わります。
  • 標本の形式(数値ではなくコインの裏表みたいな2値のデータの場合など)が変わった場合もまとめ方と分布が変わります。
  • 標本のとり方に制約がある場合はちょっと複雑なまとめ方がいるかも知れません。
  • しかし、どんな複雑に見える手法も、そういった変更や課題への対策の結果生まれてきただけで、根底となる考え方に大きな違いはありません。

というような解説をしてくれています。

統計入門書をある程度理解した段階で、より高度な書籍に手を出す前にこの本に出会うことは後の学習効率において大きなプラスになると思います。

この本をおすすめできない方

逆に、目の前にすでにデータが与えられており、なにか分析して報告しなきゃいけない!と切羽詰まっている方にはおすすめしません。この本を読んでもすぐには役に立ちません。

本書の最大の特徴である大胆な絞りこみを裏返して言えば、具体的な手法は全然紹介されないとも言えてしまうので・・・

なんせ一冊かけて 正規分布しか出てこないし 検定は出てくるけどt検定ですらないからな~

avatar

くまひろ

厳密には他の分布も少し出てきますが、解説しようという気は全くありませんし、手順についての記載は皆無です。

avatar

てん

こういうデータが有って、こういうレポートを早く書きたいんだ!

という、明確な目的を抱えている状況の方は、解析手法を優しく説明している入門書を探してください

まとめに代えて:このシリーズ大好き

この「この世で一番おもしろい」はシリーズになっていまして、「この世で一番おもしろいミクロ経済学」「この世で一番おもしろいマクロ経済学」も刊行されています。統計に関する書籍ではないですが、「この世で一番おもしろい統計学」同様、ユーモアの秀逸な「おもしろい」本になっています。
 

avatar

てん

しかしこの先に進むものはすべての希望を捨てよって締めくくるセンスは脱帽だわ

すべての希望を捨てるより前に

avatar

くまひろ

avatar

てん

なんでもご質問ください

でわでわ

 

余談

巻末の訳者コメントを読んでいて、統計ブームの立役者のお名前が登場していました。「統計学が最強の学問である」の西内啓氏が本書のレビュアー(統計学上正しい表現であるかの監修)に入っているそうです。

スポンサーリンク

-統計
-, ,

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

AIに仕事を奪われないために必要な能力って何か考えてみたよ

てん@統計屋さんです AIによって仕事が奪われるのでは?そんな話題を耳にするようになって久しいです。 最も有名なのは、2015 年 12 月 2 日に野村総研が英オックスフォード大学との共同研究で発表 …

外れ値への対処法を考えてみたよ

てん@統計屋さんです 以前の↓ネタ記事↓にたどり着いた方の検索ワードで、ひときわ目立ったものがあります。 データをてんから見てみよう  1 Pocket統計学的有意差検定での危険な考え方を念 …

だめな外れ値の対処法も紹介するよ

てん@統計屋さんです この記事は、以前の記事の続きです。外れ値の取扱として、だめな例を紹介しています。正当になりうる取扱いについては下の記事を確認ください。 データをてんから見てみよう外れ値への対処法 …

年金は何歳から受給するのが一番お得?-受給金額の期待値を計算してみた-

てん@統計屋さんです 個人年金をFPさんに相談する程度には、老後資金の準備に興味があります。老後資金の基盤となるのは公的年金つまり基礎年金(+厚生年金)です。今般の2000万円問題に関連して、各ワイド …

Student-t検定の前に行う正規性の検定・不等分散性の検定の必要性について考えてみたよ

てん@統計屋さんです 2群間の平均値が異なるかを確率的に評価する有意差検定として、Student-t検定というものがありますね。 おそらく、統計学的有意差検定を習ったことのある方は、Student-t …

スポンサーリンク

スポンサーリンク