なぜ統計学は最強の武器になるのだろうか? その答えを一言でいえば、どんな分野の議論においても、データを集めて分析することで最速で最善の答えを出すことができるからだ。
統計学がパワフルなものであるのならば、もっと前から社会のいたるところで使われているべきじゃないか?という疑問ももっともだ。その答えは統計学自体ではなく、統計学を活用するための環境の変化にある。もしみなさんが、大学時代の授業などから統計学に退屈なイメージを持っているのだとすれば、「紙とペンの統計学」ばかりを教育されたために、時代の最前線で最善の答えを生み出し続けるITによる統計学のパワフルさを体感できていなかったことが1つの理由なのかもしれない。
「ふ~ん」としか言えないグラフ
データ分析において重要なのは、「果たしてその解析はかけたコスト以上の利益を自社にもたらすような判断につながるのだろうか?」という視点だ。顧客の性別や年代、居住地域の構成を見ると何%ずつでした、あるいはアンケートの回答結果を見ると「とてもそう思う」と答えた人が何%いました、といったデータの集計を「解析結果」として示されることはしばしばある。コンサルタントだとかマーケターだとか名乗る人々の中にも、適当なアンケートを取ってキレイな集計グラフを作ることのみを生業にしているんじゃないかという人すらいる。だが、果たしてこれらの結果に「なんとなく現状を把握した気になる」という以上の意味はあるだろうか?
統計解析は3つの問い
問1 何かの要因が変化すれば利益は向上するのか?
問2 そうした変化を起こすような行動は実際に可能なのか?
問3 変化を起こす行動が可能だとしてその利益はコストを上回るのか?
「意味のある偏り」なのか、それとも「誤差でもこれぐらいの差は生じるのか」といったことを確かめる解析手法に「カイ二乗検定」というものがある。実際には何の差もないのに誤差や偶然によってたまたまデータのような差(正確にはそれ以上に極端な差を含む)が生じる確率のことを統計学の専門用語でp値という。このp値が小さければ(慣例的には5%以下)、それに基づいて科学者たちは「この結果は偶然得られたとは考えにくい」と判断するというわけである。