みなさんは普段、いったいどれくらいの確率のことが起きれば、それは偶然ではないと考えたことがあるでしょうか?
10回に1回?
それとも100回に1回くらいの確率でしょうか。。。
このような疑問に対する一つの答えが統計学なんですね。
今回は統計学の基礎の基礎として、現代統計学の出発点にもなった紅茶貴婦人の話をしたいと思います。
今回の説明を聞けば、統計学における「推定」について、「何となくそういうものなんだなぁ」と少しわかった感じがします。
センスの良い人は、今回の説明だけでも統計学の入口に立つ準備ができると思いますので、最後まで読んでいってください。
さて、毎回、サッカーのワールドカップが近づくと怪しげな予言が話題に上ります。
多くの方が、ニュースなどで目にしたことがあるかと思うのですが、ドイツに居るマダコのパウエル君をご存知でしょうか?
2010年のサッカーワールドカップ南アフリカ大会で有名になりましたね。
このパウエル君、予選を含む決勝戦までの全8試合の全ての勝敗を的中させました。
凄いですよね。
ちなみに、この大会の前の国際大会であるEURO2008では、6試合中2試合を外しているのは内緒の事実です。
日本でもラビオ君という北海道小平町のミズダコが居ます。
このラビオ君は、2018年のサッカーワールドカップロシア大会で、日本チームの勝敗を的中させて話題になりました。
このような報道を受けて、もしかしたら何かしらの予知能力があるのではないか?
と思ってしまうのも無理のない話です。
海洋生物であるタコが、「3.7%の確率で脅威的な的中率を証明した」と言ってもですよ。
まさか私たちは、タコが情報を集めて予測したとは考えません。
偶然と考える人が殆どでしょう。
これが人間の場合は尚更です。
05:22
※記載ミスがありました。「確率統計学」→『記述統計学』です。
■統計学の始まりの話
統計学上、有名な「紅茶婦人」というエピソードがあります。
こんな話です。
イギリスの貴婦人が
「紅茶とミルク、どちらを先に入れるかで紅茶の味に違いがでるのよ」
「私は、その味の違いが見分けられるわ」
と言いました。
これを聞いた紳士淑女は。
「紅茶とミルクの順番で味に違いが出るはずがない!」
とか
「そんなことは聞いた事が無い!」
とか
「詐欺だ!」
と大騒ぎ。
殆どの人が信じない中、
「おもしろい話じゃないか」
「それが嘘か本当かテストしてみよう」
と、ある紳士が提案しました。
この紳士こそ、統計学の始祖ともいわれる、R・A・フィッシャーと言われています。
さて、この提案には一つ問題があります。
それは、
という事です。
この時、フィッシャーがどのようにして第三者が判断するのか?
については本屋さんにある統計学の本を是非読んで頂きたいのですが
少し難しい内容に感じる方もいると思うので、私の説明では別のもっと簡単な方法を取りたいと思います。
■連続で正解する確率?
さて、1杯の紅茶でテストをしただけならどうでしょう。
この場合の確率は50%なので、まぐれで当たる確率が高いでしょう。
では、2回続けて正解したらどうでしょうか?
この場合の確率は50%×50%なので、25%です。
4回に1回は正解する確率になりますので、先ほど騒いでいた紳士淑女を納得させることはできないでしょう。
では、3回連続で正解した場合はどうでしょうか?
確率は1/8ですので、12.5%になります。
4回連続正解なら?
1/16ですので、6.25%です。
もう一押し、5回連続正解なら?
1/32ですので、3.125%です。
このように「どこまで行けば偶然ではない」と判定してもらえるのか?
キリの無い話になりそうです。
このキリの無い話に、キリを付ける判定方法こそが統計学の基礎なのです。
■推定統計学と線引き
この紅茶貴婦人の話は、現代統計学の出発点にもなったテーマです。
この話を起点に、キリを付ける為の「線引き」の発想が生まれ、確率的に考えることになりました。
以前の記事でも述べましたが、統計学には大きく分けて「記述統計学」と「推定統計学」の2種類があります。
たまたま当たる確率ってどれくらいだろう?統計学や確率って難しい!今回は、このような悩みを解決するヒントとして簡単に確率について説明していきます。 最初に、記事の概要です。・ジ[…]
現代の統計学は、このうち「推定統計学」が中心です。
推定統計学とは簡単に言うと、おおもとの集団である母集団の一部のデータを基に、母集団の状況を推定したり、検定したりする統計学です。
さて、紅茶貴婦人の話に戻しましょう。
多くの人が納得できるであろう、
という話でした。
統計学は数学を多用しますが、ここが数学と最も異なるところです。
数学では解が決まっていますが、統計学では妥協点という何とも曖昧な線引きを行います。
多くの人が、
「これだけ確率的に低い事が起きれば、そう信じるしかない!」
と思えるレベルを決めてしまおうとするのが統計学です。
例えば紅茶貴婦人の連続正解が、20回連続だった場合。
偶然正解を当てる確率は100万回に1回の確率になります。
さすがにこの確率であれば、偶然当てるには無理がありすぎるので、誰もが納得するレベルです。
では、1万回に1回の確率ならどうでしょうか?
1000回に1回なら?
結論から言うと、統計学では
と判断します。
20回に1回の確率です。
先ほどの紅茶貴婦人の話の場合、5回連続で当てることができれば、確率的には5%を下回ります。
5回連続正解の確率は3.125%です。
どうですか?
思ったより少ない妥協点だったでしょうか?
これは統計学の基礎であって、実際の使われ方は
その対象によって更に低い確率しか認めない場合も多く存在します。
例えば、自動車などの人の命に係わる製品の場合、
5%程度の確率で不具合が起きたら大変な事になりますよね。
ですので、個々の製品毎に妥協点が異なるのは、通常のことなのです。
■まとめとオマケ
最後にアミダくじの裏技についてお話して、今回の記事を終了したいと思います。
その前に、少し内容が多くなりましたので、簡単にまとめておきましょう。
1.紅茶貴婦人の話が現代統計学の起点となった。
2.統計学では、誰もが偶然ではないと納得できる妥協点を決めるのが重要である。
3.統計学では5%以下では偶然ではないと判定するが、それは対象によって異なり、更に厳しい判定方法を用いている製品が世の中には多い。
以上、3点でした。
何かを公平に決めようとするとき、または無作為に割り振りを行う時など、アミダくじを用いることがあると思います。
このアミダくじですが、横に引く線の本数によって、実は偏りが生じます。
詳しい説明や計算は避けますが、例えば、10人で何かを決めたいときのアミダくじを想像してみてください。
縦線はもちろん10本になります。
ここで1人に1本か2本の横線を入れてもらう事にします。
このアミダくじの場合、選んだ縦線の真下付近に辿り着く確率が非常に高くなります。
1番を選んだなら、1番か2番の真下になりやすくなる、という事です。
実際のケースでも、2本くらいの横線を引いてもらう事が多いと思います。
この事を知っておくと、くじを引くときに役に立つかもしれませんね。
最後の最後に、重要な事をお伝えします。
統計学における確率の話には、
という点です。
ですので、100%正しい、とか絶対に正しいと、ならないのが統計学なのです。
つまり、「絶対ではないけれど多くの人が納得はするよ」というのが統計学とも言えます。
それでは最後まで読んで頂き、ありがとうございました。