ベイズの定理をわかりやすく説明

PR

「ベイズの定理」…。統計の勉強をしているとちょくちょく出てくる定理です。

特に条件付き確率と深い関わりをもつこの定理。「条件付き確率って?」という人はこちらを先に読んでおいてください。

ベイズの定理は計算方法は「まぁそんなもんか」とわかりやすいのですが、「で?どういう意味があるの?」というのがわかりにくい定理です。

ですが、実際には実生活の様々な場所でこのベイズの定理は使われます。

実例をあげながら、わかりやすく説明していきたいと思います。

目次

ベイズの定理

たろぅ

せんせい!「ベイズの定理」ってなんですか?教えてください!

せんせ

…また急ですね。どうかしましたか?

たろぅ

いや、「ベイズの定理」ってのは実生活でもよく使われるんですよね?

せんせ

そうですね、特に事前確率(前もって得られている確率情報)から事後確率(その条件を与えられたときに、これから起きるであろう確率)を求めることができるので、その辺が有用性の高い部分ですね。

たろぅ

よし!それを使って、「この後の時間にせんせいに当てられる確率」を求めて対策するんです!教えてください!

せんせ

…別にいいけど。じゃあまずは、ベイズの定理の説明からしましょうか。

こちらで説明しましたが、「事象Aが起きた上で事象Bが起きる条件付き確率を\(P(B|A)\)と表記する」とします。

では、ベイズの定理とは何か?

\(\displaystyle P(B|A)=\frac{P(A \cap B)}{P(A)}\)…① です。

一方、AとBを逆にした、「事象Bが起きた上で事象Aが起きる確率を条件付き確率」は

\(\displaystyle P(A|B)=\frac{P(A \cap B)}{P(B)}\)…② です。

①より、\(P(A \cap B)=P(A)P(B|A)\)ですよね?

②より、\(P(A \cap B)=P(B)P(A|B)\)ですよね?

よって、\( P(B)P(A|B)=P(A)P(B|A)=P(A \cap B)\)です。

せんせ

以上です!

たろぅ

へ?それだけ?

ベイズの定理

\( P(B)P(A|B)=P(A)P(B|A)=P(A \cap B)\)

ただし、\( P(B)P(A|B)=P(A)P(B|A)\)より、

\(\displaystyle P(A|B)=\frac{P(A)P(B|A)}{P(B)}\)の形で使うことが多い。

たろぅ

これで何かいいことあるんですか?

せんせ

条件付き確率\(P(A|B)\)を条件付き確率\( P(B|A) \)を使って求めることができるのが嬉しいところですね。

ベイズの定理を使ってみよう!

たろぅ

よし!じゃあ、事前に調べておいたこの「せんせいの質問に関する考察ノート」を使って条件付き確率を計算してみましょう!

せんせ

どれどれ、見せてください…。

せんせいは、日頃からいじわるな質問ばかりするのですが、たまに生徒に当てまくる「鬼モード」に入ることがあります。この「鬼モード」に入ると、生徒は必ず当たってしまいます。そのくらい質問しまくります。

日頃の授業では、あまりこの「鬼モード」になることはありません。全体で計算すると、5%の確率で「鬼モード」に入ります。

ですが、僕は気づいてしまいました。ある条件を満たすと、高確率で「鬼モード」に入るようです。

長期にわたる統計データを取った結果、どうやらこの「鬼モード」に入るのには『授業変更』とその『時間』が深く関係しているようです。

「鬼モード」に入ったとき『4限に授業変更で授業をしていた』、という条件付き確率はなんと驚異の90%!せんせいは多分、授業が増えるし、お腹も空くので不機嫌なのでしょう。

そして、授業変更で4限に授業が入る確率は6%です。

せんせ

…。

たろぅ

明日は数学がない日ですけど、授業変更で4限に授業が入ったんです!「鬼モード」に入られるとヤバいんですが、どのくらいの確率で「鬼モード」に入るんでしょうか!?

せんせ

…じゃあ計算してみましょうか。

「鬼モードに入る」という事象を「鬼」。

「4限に授業変更で授業が入る」事象を「4」と書くとする。

求めたい条件付き確率は、「4限に授業変更が入っているという条件のもと鬼モードに入る条件付き確率」です。

つまり、\(P(鬼|4)\)ですね。

また、データから、\(\displaystyle P(鬼)=\frac{5}{100}\)、\(\displaystyle P(4|鬼)=\frac{90}{100}\)、\(\displaystyle P(4)=\frac{6}{100}\)、がわかっています。

ベイズの定理より、

\(\displaystyle P(鬼|4)=\frac{P(鬼)P(4|鬼)}{P(4)}\)

\(\displaystyle =\frac{\frac{5}{100} \cdot \frac{90}{100}}{\frac{6}{100}}=\frac{75}{100}\)…(答)

たろぅ

なんと!せんせい!ヤバいです!普段は5%程度の「鬼モード」の確率が、明日の4限は75%の確率で「鬼モード」です!どうしましょう!?

せんせ

…いえ、心配しないでください。

たろぅ

え?明日はなんかいいことでもあるんですか?機嫌いい日ですか?

せんせ

明日は100%「鬼モード」になると思いますから。余計な心配はせずに、しっかり予習しといた方がいいですよ…。

たろぅ

…ん?なんで?なんか悪いことしたかな…?せっかくの計算が無駄になってしまったぞ…。

今回の例でいうと、「全体で鬼モードに入る確率は5%」ですが「鬼モードに入ったときに4限に授業変更で授業をしていた確率は90%」と高いですよね。

つまり「全体でみれば鬼モードに入る割合は少ないけれど、実際はそのほとんどが4限に授業変更があったとき」といえます。

なので、「もし4限に授業変更で授業があったら要注意だ」というのもわかると思います。

ベイズの定理で計算してみると、全体では5%のところが75%にまで跳ね上がってますね。これが事前データと条件を使って導き出した、実際に起こりうる可能性になります。

まとめ

ベイズの定理は、事前のデータを使うことで、ある条件が与えられたときにその精度を上げることができます。この技術は「迷惑メールの判定」や「自動運転」に役立っています。

条件付き確率は「よくわかんない」という人も多いですが、こちらの記事も合わせて読みながら、条件付き確率の有用性を感じていただければ、と思います。

ちょっと一息

このブログで活躍してるクマのLINEスタンプもあります!

Youtubeもやってます!数学とは全然関係ない、ゆるいバイク動画です。気晴らしにどうぞ!

あなたへオススメ!
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次