統計学が最強の学問である

なぜ統計学は最強の武器になるのだろうか? その答えを一言でいえば、どんな分野の議論においても、データを集めて分析することで最速で最善の答えを出すことができるからだ。
統計学がパワフルなものであるのならば、もっと前から社会のいたるところで使われているべきじゃないか?という疑問ももっともだ。その答えは統計学自体ではなく、統計学を活用するための環境の変化にある。もしみなさんが、大学時代の授業などから統計学に退屈なイメージを持っているのだとすれば、「紙とペンの統計学」ばかりを教育されたために、時代の最前線で最善の答えを生み出し続けるITによる統計学のパワフルさを体感できていなかったことが1つの理由なのかもしれない。
「ふ~ん」としか言えないグラフ
データ分析において重要なのは、「果たしてその解析はかけたコスト以上の利益を自社にもたらすような判断につながるのだろうか?」という視点だ。顧客の性別や年代、居住地域の構成を見ると何%ずつでした、あるいはアンケートの回答結果を見ると「とてもそう思う」と答えた人が何%いました、といったデータの集計を「解析結果」として示されることはしばしばある。コンサルタントだとかマーケターだとか名乗る人々の中にも、適当なアンケートを取ってキレイな集計グラフを作ることのみを生業にしているんじゃないかという人すらいる。だが、果たしてこれらの結果に「なんとなく現状を把握した気になる」という以上の意味はあるだろうか?
統計解析は3つの問い
問1 何かの要因が変化すれば利益は向上するのか?
問2 そうした変化を起こすような行動は実際に可能なのか?
問3 変化を起こす行動が可能だとしてその利益はコストを上回るのか?
「意味のある偏り」なのか、それとも「誤差でもこれぐらいの差は生じるのか」といったことを確かめる解析手法に「カイ二乗検定」というものがある。実際には何の差もないのに誤差や偶然によってたまたまデータのような差(正確にはそれ以上に極端な差を含む)が生じる確率のことを統計学の専門用語でp値という。このp値が小さければ(慣例的には5%以下)、それに基づいて科学者たちは「この結果は偶然得られたとは考えにくい」と判断するというわけである。


IQすなわち知能指数という言葉は小学生の読む漫画の中にも登場するが、ほとんどの人はこの指標の意味を分かっていないのではないだろうか。アインシュタインのIQはすごく高いらしい、といった話が話題になることもあれば、人間の価値はIQじゃ測れないとか、IQよりもEQが重要だなんていう本が売れたりもした。だが、身長や体重、血圧のように物理的に測定できるものと違って、知能というものは見たり触れたりできるものではない。知能とはそもそも何で、いったいどうすれば測れるというのだろうか。そしてなぜ、現在用いられているIQテストのようなもので知能は測定できたというのだろうか。こうしたことを理解せずにIQの高さをありがたがるのも、反対にIQという指標自体を攻撃するのも滑稽なことである。IQとは何かを理解しようとすれば、心理学者がこの100年で積み上げてきた統計手法について学べばいい。
もしあなたが会社の人事部で新卒採用を担当していたとして既存の知能テストを用いずに「知能の高い学生を採用するやり方を考えてくれ」という仕事を割り振られたらどうするだろうか。簡単な指示に対する反応速度を測定しようとする人も、文字の羅列を一定時間に何文字記憶できるか測定しようとする人もいるだろう。あるいは単純に算数や国語の抜き打ちテストを出すというやり方もある。実際に、統計学的な裏付けもなく、思い付きでこうしたテストを採用基準に用いている企業も少なくない。
実はこうした試みは19世紀時点ですでにやり尽されているようで、現在の知能研究の基礎を生み出した心理統計家であるスピアマンの1904年の論文において、「イマイチな先行研究」として紹介されているのだ。なぜイマイチか、というと、結局のところこれらは知能を現すだろうという基準をなんらかの形で定めて測定してみました、というだけの話にすぎないからだ。「そもそも知能とは何か」という問いには研究者の直観でしか答えていないのである。
スピアマンは、こうした先行研究で示されていた種々の知能の測定方法をいくつか選び、研究参加者に対して試してみた。そしてそれぞれの「知能を現すはずの指標」の間の相関を分析したのである。スピアマンが発見したのは、異なる知能の側面同士がある程度相関しているという結果である。またさらに、それぞれの指標に一定の重みをつけて足し合わせると、すべての指標とよく相関する1個の合成変数が作り出せるということもわかった。全く別々に考案された知能にかかわる指標すべてと相関する合成変数が作り出せたのであれば、これこそが潜在的な知能を表しているのではないかと彼は考えた。彼はこの指標のことを一般知能と呼んだ。
スピアマンが行った分析方法は今では因子分析と呼ばれている。なお、因子は必ずしもスピアマンの一般知能のように「すべての測定項目と相関する1つの因子」だけとは限らない。複数の因子が抽出されることもある。そうした研究の中で有名なものの1つが、1938年に発表されたサーストンの多因子知能説である。サーストンが様々な知能にかかわるテストの結果を因子分析した結果、
1.空間や立体を知覚する空間的知能
2.計算能力についての数的知能
3.言葉や文章の意味を理解する言語的知能
4.判断や反応の速さに繋がる知覚的知能
5.論理的推論を行う推理的知能
6.言葉を早く柔軟に使う流暢的知能
7.暗記力を示す記憶知能
といった7つの知性を示す因子が抽出された。近年の知能研究の中でもこの一般知能か多因子知能かという議論は繰り返されているが、多くの知能検査方法を分析すると、「分野ごとではなく検査項目全体と相関する因子」すなわち一般知能がだいたい全得点の30~60%ほどの影響力を持つようである。ただし、この一般知能とは一体何か、という点はいまだ明確な答えを出せていない。
ただし、日本で一般的に用いられている知能テストは、ここで紹介したような注意深い心理統計学的な検討を経たものではない。例えば比較的日本でよく用いられる知能検査方法の1つである「田中ビネー式検査」はもともと1905年にアルフレッド・ビネーが同年齢の子供と一緒に勉強することについていけない子供を探すために、自らの娘の発達過程を観察した結果をもとに作ったものである。この尺度で高得点を出したから「天才児」というのは本来の使い方ではない。心理尺度だろうが物理的な尺度だろうが、そもそもの定義と尺度の使い道がかみ合っていなければ意味がないのは同じである。「体格の良い子供を探したい」と思ったとき、バスケットボール選手を育てたいのか相撲取りを育てたいのかによって身長を見るべきなのか体重を見るべきなのかは違うのだ。

統計学が最強の学問である[実践編] 統計学が最強の学問である[実践編]
西内 啓

ダイヤモンド社 2014-10-23
売り上げランキング : 2457

Amazonで詳しく見る by G-Tools