統計学や確率って難しい!
今回は、このような悩みを解決するヒントとして簡単に確率について説明していきます。
最初に、記事の概要です。
・ジャンケンの達人が勝つ確率
・誕生日が同じ日になる確率
・統計学の種類
このような流れで説明していきます。
この記事を読む事によって、確率ってそんなに難しくない!という事に気付いて頂けたら幸いです。
それでは早速やっていきましょう。
■確率の基礎の基礎(ジャンケン達人が勝つ確率)
ジャンケンの達人が居たとします。
このように、どの基準で線引きするのが妥当なのか、を判断するのが統計学です。
何かを決めるときには、どういう基準で線引きするか、は非常に重要なポイントになってきます。
そうしないと、全てを調査する必要が出てくるからです。
全てを調査するなんて、大変ですよね。
前回の記事でもお伝えしたように、テレビの視聴率調査も、全ての家庭で行っているわけではありません。
統計学は難しい。統計学の入門書を読んだが理解できなかった。数字アレルギーがあります。中の人では統計学の基礎の基礎から説明します。中学数学で理解できるよう噛み砕いて説明するの[…]
どこで線引きするか?
これは統計学において、非常に重要な考え方ですので覚えておいて損はないと思います。
さて、ジャンケンの達人の話ですが、あまりに多くの数で判定すると大変なので、簡単なところから始めます。
まず、第1回戦の確率から見ていきましょう。
●ジャンケンの確率
① 勝つ
② 負ける
③ 引き分け
の3パターンがあります。
ですので、1回戦の確率は1/3です。
1回戦に勝つだけなら、確率は1/3ですから33.3%になります。
では、3戦とも連続して勝つ確率はどれくらいでしょうか?
になります。
この時点で間違わないでくださいね。
連続して起きる確率ですので、分数は掛ける事になりますからね。
間違っても足してはいけませんよ。
1/27ですので、3.6%ぐらいの確率です。
0.33×0.33×0.33=0.035937
3回連続でも、思ったより確率としては低いと感じた事でしょう。
さて、ジャンケンの達人と呼んでも良い確率でしょうか?
先に答えを伝えますが、この確率の場合 少し足りない感じです。
・片側検定
・両側検定
の2種類ありますが、片側検定であればOKです。
ですが、ジャンケンには勝つ確率と負ける確率の両方ありますので、両側検定で行う必要があります。
両側検定だと、確率的に少し足りないのです。
この辺りは、別途説明する記事を書きます。
■誕生日が同じ日になる確率を簡単に説明
先ほどのジャンケンの達人の答えを出す前に、次の事例でも勉強してみましょう。
学生時代を思い出してください。
思い出せない人、思い出したくない人は、会社の部署の人数でも構いません。
例えば、同じ部署内に25人居たとします。
ここで問題です。
と聞かれたとき、「居る」と「居ない」では、どちらの確率が高いでしょうか?
先ほどよりも少しめんどくさくなりましたね。
3パターンだったのが、25人に増えましたから。
こうした問題は次のように考えて下さい。
① 1年は365日です。
② もしも、全員が違う誕生日だった場合。
③ 1人目の誕生日と2人目の誕生日は違うわけですから、
2人目の誕生日は364日のどれかになります。
④ これは自分の誕生日の分、1日を引いた1年間の日数になります。
⑤ 364/365です。
同じように、3人目の誕生日も前の2人と違うわけですから、3人目は363日のどれかになります。
363/365です。
ずっと同じように、最後の25人目まで計算していくと、25人目では341日のどれかになります。
341/365です。
これを25人分、掛け算で計算していきます。
=0.431248219178
計算できました。
25人目は、0.43です。
つまり、すでに5割を切っています。
という事は同じ誕生日の人が、少なくとも1人は居る確率の方が、1人も同じ誕生日の人が居ない確率よりも高いという事です。
ちなみに実際には、23人目で5割を切ってきます。
このように「確率的に考える思考」が身に付くと、
偶然に起きた事なのか?
そうではないのか?
が判断できるようになります。
単なる偶然なのか、そうでないのかを判断できる事は、ビジネスにおいて必要な場面も多いですので、この考え方を覚えておきましょう。
この話を更に深掘りした、「確率」と「推定」の記事はコチラからどうぞ。
みなさんは普段、いったいどれくらいの確率のことが起きれば、それは偶然ではないと考えたことがあるでしょうか?10回に1回?それとも100回に1回くらいの確率でしょうか。。。 […]
■統計学の種類
統計学は大きく分けて3つの種類に分類されます。
の3つです。
この「統計学の基礎の基礎」のシリーズでは、○○統計学という分野には有料noteでしか踏み込みません。
ですが、簡単に説明しておくと。
記述統計学とは、データを集計して簡単に分かりやすく表現する、という統計学です。
普段の仕事でよく使う、平均値を出すのも記述統計学です。
他にも、エクセルで表にするとか、グラフにするとかも記述統計学になります。
普通に仕事で使っていますよね。
推測統計学とは、一部のデータの特徴から、母集団全体の特性を推測する学問です。
日本人全体の平均年収ってありますよね。あれは推測統計学です。
他にも、模試テストの結果から、本番の入試の点数を推測したり、合格の可能性を出したりする場合があります。
これも推測統計学です。
詳しくは、回帰分析と呼ばれる手法なのですが、詳しい説明は頭が痛くなると思うので避けますね。
ベイズ統計学とは、ベイズの定理を用いた統計学です。
かなり特殊です。
最初に学ぶのはお勧めしません。
記述統計学や推定統計学では、母数が不変であるという考えなのに対し、
ベイズ統計学では母数は変わって良いとされています。
記述統計学や推定統計学では、データが変わるという考えなのに対し、
ベイズ統計学ではデータは不変です。
少し難しい言い方をすると、
という特徴があります。
例えば、隣の席のおじさんが転職を考えている確率、などです。
こんなの分かるはずがない!
という確率を求めるのが主観確率です。
新しい情報を得る度に、確率をアップデートしていきます。
何も情報のない事前確率の状態から、例えば隣のおじさんに聞いてみるなどして、結果を得ます。
そして結果である事後確率から、主観確率を設定しなおします。
学習機能があるのです。
この事により、いま最も注目されているのがベイズ統計学です。
コンピューターとの相性が良いからです。
例えば、SNS、監視カメラの映像、GPS記録、などなど。
ビックデータを活用して機械学習を行う、現代の生活に役立つ統計学である事が注目の理由となっています。
ちなみに、迷惑メールやスパムメールの判別にも、ベイズ統計学が使われています。
※ベイジアンフィルター。
■まとめ
今回は、確率の基礎の基礎を説明しました。
身近なものに統計学が使われている事が理解できたことかと思います。
今回の記事の内容としては以上ですが、最後に補足です。
このように一見難しそうな統計学ですが、難しい数式を使用しない段階では、非常に面白い学問だと思います。
Professional養成講座の「統計学の基礎の基礎シリーズ」では、簡単に楽しく学べる統計学をお伝えしています。
「統計学の基礎の基礎」を読んで、こちらの記事に辿り着いた人が大半かと思います。 このシリーズは、統計学とはいったい何な…
ただし、最初に2点だけお伝えしたい事があります。
1つ目は、note記事は有料だという事です。
有料とは言っても、1記事350円です。
最近の雑誌と同じくらいの金額です。
そして雑誌よりも、あなたにとって価値があります。
ビジネスに役立つからです。
2つ目は、このシリーズだけで統計学を理解した、とはならないという事です。
しかし、統計学を入門するための、門の前に立つ事はできます。
書店に行って統計学の本を購入した時、その内容が理解できるようになる助けにはなるでしょう。
身に付けた統計学は、必ずあなたの武器になります。
始まったばかりのシリーズですが、周りの人と差を付けたいと考えている人は、試しに読んでみて下さい。
「統計学の基礎の基礎」を読んで、こちらの記事に辿り着いた人が大半かと思います。 このシリーズは、統計学とはいったい何な…
最後までありがとうございました。