統計でウソをつく法

統計でウソをつく法―数式を使わない統計学入門 (ブルーバックス)

統計でウソをつく法―数式を使わない統計学入門 (ブルーバックス)

統計でウソをつく法 / ダレル・ハフ
を読了。


出てきた生データをもとに、統計でいういろんな用語を駆使しながらだます方法を考える。
統計学の古典的な名著で、出版も1968年と古い。


中身自体は、読んでもらえればわかるので、なんでこんなことが起こるのか、というお話を。


昨日確率のお話をしましたが、
森羅万象を記述したΩという集合を考えるわけですが、
とりあえず、なにがしかの出来事が起こっているだろう、とΩに思うわけです。


で、いろんな出来事はΩの一部分だと思うわけですね。
それをサンプルと呼びます。


で、このサンプルってのは、たくさんとればとるほど、Ωという理想状態に近いデータが出てくるだろう、
という考え方をするのが、Fisherによって確立された統計学です。


Ωという空間が、動かない、静的に抽象的に存在する、と考えるわけです。
で、いろんな現象は、これに従っている。
つまり、サンプルもこれに従っている。
で、サンプルは無限個とると、これに近くなる。
ってことは、サンプルの性質を調べることが、ある程度、
もっと後ろにある、「真実」に近づく方法だ!


って思うのが、いわゆる統計学を支えている基本原理です。


サンプルはある「真理」に従っていて、
「真理」に近づくために、サンプルをいじいじする、という
ここのサンプルから「真理」へのジャンプを巧みに操作することで、
別のものへ導くことができるのが、
いろんなこの本で紹介されているだます技術のうちの一つなんですね。


立場の違いに、「学習」と呼ばれる分野がありまして。


心理学の本にこんなことが書いてあったのですが
「人間の脳のエラー
コインが表が出続けたら、次も表が出ると思ってしまう。実際は確率1/2で表か裏が決まるのに。」


みたいな話があったのですが、これは、立場の違いの問題で。
Ωが背後に存在する、というものの見方を採用すると、実際次も表が出ると思うのは間違いです。


しかしながら、
自分が体験したものしかわからない、という立場で物事を考えるとしましょう。
森羅万象が記述された真理なんて嘘だ。
世の中で起こったことしかわからない。
なら、起こったことから次を予測するほうが立場としてはいいんじゃないか。
こんな考え方がbayseの統計学の考え方で。
(別にだからこっちがウソがない万能だ、って言っているわけではまったくないよ)


で、この本は、前者の固定的な統計学の方法に基づいています。
そう思えば、こんなウソがいろいろ出てくるのもわかるかも。



この本は、数字と統計でウソをつく方法について述べられていて。
数字を出すともっともらしいから、それをうまくつかってしまうと人がだませる、という本。


グラフのスケールを変えたり、とかそういうただのテクから、
サンプル集団を変えたりするような統計の数字を操作まで。


相関はロジックの順番まで述べていない、というのも、
とくに統計つかって相関分析やるような人は知っておいたほうがいいこと。


でも統計学も無能じゃない。
正しく用いれば、正しい性質がわかる。
そんな本。