PR
ベイズの定理をわかりやすく説明
「ベイズの定理」…。統計の勉強をしているとちょくちょく出てくる定理です。
特に条件付き確率と深い関わりをもつこの定理。「条件付き確率って?」という人はこちらを先に読んでおいてください。
ベイズの定理は計算方法は「まぁそんなもんか」とわかりやすいのですが、「で?どういう意味があるの?」というのがわかりにくい定理です。
ですが、実際には実生活の様々な場所でこのベイズの定理は使われます。
実例をあげながら、わかりやすく説明していきたいと思います。
ベイズの定理
せんせい!「ベイズの定理」ってなんですか?教えてください!
…また急ですね。どうかしましたか?
いや、「ベイズの定理」ってのは実生活でもよく使われるんですよね?
そうですね、特に事前確率(前もって得られている確率情報)から事後確率(その条件を与えられたときに、これから起きるであろう確率)を求めることができるので、その辺が有用性の高い部分ですね。
よし!それを使って、「この後の時間にせんせいに当てられる確率」を求めて対策するんです!教えてください!
…別にいいけど。じゃあまずは、ベイズの定理の説明からしましょうか。
こちらで説明しましたが、「事象Aが起きた上で事象Bが起きる条件付き確率を\(P(B|A)\)と表記する」とします。
では、ベイズの定理とは何か?
\(\displaystyle P(B|A)=\frac{P(A \cap B)}{P(A)}\)…① です。
一方、AとBを逆にした、「事象Bが起きた上で事象Aが起きる確率を条件付き確率」は
\(\displaystyle P(A|B)=\frac{P(A \cap B)}{P(B)}\)…② です。
①より、\(P(A \cap B)=P(A)P(B|A)\)ですよね?
②より、\(P(A \cap B)=P(B)P(A|B)\)ですよね?
よって、\( P(B)P(A|B)=P(A)P(B|A)=P(A \cap B)\)です。
以上です!
へ?それだけ?
ベイズの定理
\( P(B)P(A|B)=P(A)P(B|A)=P(A \cap B)\)
ただし、\( P(B)P(A|B)=P(A)P(B|A)\)より、
\(\displaystyle P(A|B)=\frac{P(A)P(B|A)}{P(B)}\)の形で使うことが多い。
これで何かいいことあるんですか?
条件付き確率\(P(A|B)\)を条件付き確率\( P(B|A) \)を使って求めることができるのが嬉しいところですね。
ベイズの定理を使ってみよう!
よし!じゃあ、事前に調べておいたこの「せんせいの質問に関する考察ノート」を使って条件付き確率を計算してみましょう!
どれどれ、見せてください…。
せんせいは、日頃からいじわるな質問ばかりするのですが、たまに生徒に当てまくる「鬼モード」に入ることがあります。この「鬼モード」に入ると、生徒は必ず当たってしまいます。そのくらい質問しまくります。
日頃の授業では、あまりこの「鬼モード」になることはありません。全体で計算すると、5%の確率で「鬼モード」に入ります。
ですが、僕は気づいてしまいました。ある条件を満たすと、高確率で「鬼モード」に入るようです。
長期にわたる統計データを取った結果、どうやらこの「鬼モード」に入るのには『授業変更』とその『時間』が深く関係しているようです。
「鬼モード」に入ったとき『4限に授業変更で授業をしていた』、という条件付き確率はなんと驚異の90%!せんせいは多分、授業が増えるし、お腹も空くので不機嫌なのでしょう。
そして、授業変更で4限に授業が入る確率は6%です。
…。
明日は数学がない日ですけど、授業変更で4限に授業が入ったんです!「鬼モード」に入られるとヤバいんですが、どのくらいの確率で「鬼モード」に入るんでしょうか!?
…じゃあ計算してみましょうか。
「鬼モードに入る」という事象を「鬼」。
「4限に授業変更で授業が入る」事象を「4」と書くとする。
求めたい条件付き確率は、「4限に授業変更が入っているという条件のもと鬼モードに入る条件付き確率」です。
つまり、\(P(鬼|4)\)ですね。
また、データから、\(\displaystyle P(鬼)=\frac{5}{100}\)、\(\displaystyle P(4|鬼)=\frac{90}{100}\)、\(\displaystyle P(4)=\frac{6}{100}\)、がわかっています。
ベイズの定理より、
\(\displaystyle P(鬼|4)=\frac{P(鬼)P(4|鬼)}{P(4)}\)
\(\displaystyle =\frac{\frac{5}{100} \cdot \frac{90}{100}}{\frac{6}{100}}=\frac{75}{100}\)…(答)
なんと!せんせい!ヤバいです!普段は5%程度の「鬼モード」の確率が、明日の4限は75%の確率で「鬼モード」です!どうしましょう!?
…いえ、心配しないでください。
え?明日はなんかいいことでもあるんですか?機嫌いい日ですか?
明日は100%「鬼モード」になると思いますから。余計な心配はせずに、しっかり予習しといた方がいいですよ…。
…ん?なんで?なんか悪いことしたかな…?せっかくの計算が無駄になってしまったぞ…。
今回の例でいうと、「全体で鬼モードに入る確率は5%」ですが「鬼モードに入ったときに4限に授業変更で授業をしていた確率は90%」と高いですよね。
つまり「全体でみれば鬼モードに入る割合は少ないけれど、実際はそのほとんどが4限に授業変更があったとき」といえます。
なので、「もし4限に授業変更で授業があったら要注意だ」というのもわかると思います。
ベイズの定理で計算してみると、全体では5%のところが75%にまで跳ね上がってますね。これが事前データと条件を使って導き出した、実際に起こりうる可能性になります。
まとめ
ベイズの定理は、事前のデータを使うことで、ある条件が与えられたときにその精度を上げることができます。この技術は「迷惑メールの判定」や「自動運転」に役立っています。
条件付き確率は「よくわかんない」という人も多いですが、こちらの記事も合わせて読みながら、条件付き確率の有用性を感じていただければ、と思います。