前回の記事でランダム性を確保することは難しい、と述べました。
その理由は、私たちの知らないうちにバイアスが掛かってしまうからです。
※前回の記事はコチラ
今回は、統計学におけるバイアスについて解説していきます。 ちなみにバイアスとは、傾向、偏向、先入観、データ等の偏り、のことを指します。バイアスが恐ろしい理由は、認識が偏ることで判断を誤ってしまうことです。[…]
つまり、無作為抽出するということは、どんな作為もそこにあってはならないということになります。
そもそも、完璧にランダムであるというのは、どういうことなのでしょうか?
そして、それは可能なのでしょうか?
※動画で聞き流したい人はコチラ
■ランダム性の難しさを理解しよう
ランダム、つまり無作為抽出というものがどのようなものかを実感してみましょう!
次のような問題に少しお付き合い下さい。
上の表のような何個かのマスがあるとします。
以下の文を読んで、頭の中で良いのでやってみてください。
・5個のマスがあります
・あなたは、1~10までの数字を持っています
・上の5個のマスに、無作為に数字を記入してみて下さい
単純に10個の数字を選んで、マスの中に記入するだけです。
とても簡単です。
実際に書かなくても、頭の中でやって頂いてもOKです。
さて・・・、できましたか?
では、無作為に選んだはずの5個の数字について質問します。
もし、この2つの質問のどちらかに当てはまった場合、またはどちらにも当てはまった場合。
あなたの選んだ数字は、無作為になっていません。
■無作為になっていない理由を解説
無作為に10個の数字の中から、5個選ぶという事は10面体のサイコロを振るようなものです。
この10面体のサイコロを振って、出た数字を5個書き出すのと同じなのですから……
更に、出るパターンと数は、1回に1/10の確率で出るため
10×10×10×10×10=100,000
10万通りのパターンが存在するわけです。
ちなみに、すべて異なる数字が出る確率は
10×9×8×7×6=30,240
もともとのパターン数より、70%も低い確率の条件であるという事が言えます。
どうですか?
完全に無作為にしたつもりでも、かなりのバイアスが掛かる事が分かりましたね。
しかも無意識のうちに。
現在はパソコンを使用して、ランダムに数字を選ぶことができるようになりました。
ですので、昔に比べると無作為抽出になっていると思います。
しかし、「無作為抽出が如何に難しいものか」は、理解して頂けたと思います。
■まとめ
人が無作為を完璧にやるのは、とても難しいものです。
すべての情報を整理して、過不足なく書き出す事も人間には難しい事だと思います。
しかしビジネス上では、
ちゃんと情報を整理したか?
過不足なく書き出したか?
という指摘があるのも事実です。
ビジネスで使える統計学にする為にも、こうした事実を抑えておくのが重要ですね。
今回は以上です。
ちなみに、ランダム性を「逆に」利用して成功を収めよう!
という趣旨の面白い書籍がありました。
内容として結構面白いし、実生活の役に立つと思いますので
興味のある方は、下記のリンクからどうぞ。