PR
仮説検定とは?高校数学新課程で登場!例を用いてわかりやすく説明
仮説検定とは、高校数学の新課程「数学I」で新たに登場した学習内容です。
今まで「データの分析」といえば、平均や分散を計算したり、四分位数を計算したり、箱ひげ図などを読み取ったり…計算や読み取りがメインでした。
大人の人は「データの分析…?」と思う人がほとんどと思いますが、平成25年度から数学Iで「データの分析」という分野が必修になっています。もうかなり昔の話になりますが…。
令和4年度入学から高校は新教育課程になります。新教育課程での「データの分析」は、データの意味や読み取りがメインになってきた印象です。
その中でも「仮説検定」は新たに登場した学習内容ですし、用語も沢山出てくるので、この記事でまとめていきたいと思います。
コインを使った仮説検定の例
イカサマ!
ちがう!
絶対なんかしてる!
ちがーう!
どうかしました?
あ、せんせい!たろう君がイカサマしてます!「10回コインを投げて表が出た数が多い方がジュースおごってもらう」ってゲームしてたのに、8回も表出したんですよ!絶対ズルしてます!
ただ運がよかっただけだって…
なるほど…
さて、皆さんはどう思いますか?「コインを投げて8回表」…。
「8回も表が出ることは滅多にあることじゃない。なにかズルしてる!」と思う人もいるかもしれません。
「いやぁ…今日のたろう君はちょっと運がいいだけだって。8回表くらいならあってもおかしくないんじゃない?」と思う人もいるかもしれません
こういうときに「仮説検定」の出番ですね。数学的に考えてみましょう。
ちなみに記事の後半になるほど、用語や考え方についてちょっと深めの解説をしているので、程よく切り上げてください。
ちなみに仮設検定は背理法の一種です。
「背理法…」という人はぜひこちらの記事もご覧ください!
かなり丁寧に背理法について説明しています。
数学をモチーフにしたオシャレなオリジナルグッズも販売中です!おかげさまで好評頂いてます!
普段使いしやすいグッズです。ステッカーやマグカップも人気ですよ!
仮説検定とは?帰無仮説を使って説明しよう
上の例でわかったと思いますが、「この現象は果たして理由があって起きたことなのか?それともただの偶然なのか?」を調べるのが仮説検定です。
ですので、「主張したいこと」がまず存在します。今回で言うと、
『たろう君はイカサマしてる!』=『このコインは偏りがあるはずだ!』
これが「主張したいこと」ですね。
そして、この「主張したいこと」を否定したものを帰無仮説といいます。
つまり、
「太郎君はイカサマしてない」=「このコインは偏りのないコインだ」
これが帰無仮説になります。
この帰無仮説を「数学的にあり得ませんから!」といって否定することで(棄却する、という)、「主張したいこと」が正しかったとするのが仮説検定です。
仮にこの帰無仮説が正しかったとしましょう。
「コインを投げる」という試行で表が出る確率は\(\displaystyle \frac{1}{2}\)ですので、表が8回以上(起きた現象よりもっと珍しいことが起きる確率まで考える)出る確率は、
\(\displaystyle _{10}C_8 \left( \frac{1}{2} \right) ^8 \left(\frac{1}{2}\right)^2 + _{10}C_9\left( \frac{1}{2}\right)^9 \left( \frac{1}{2}\right)^1 + \left( \frac{1}{2}\right)^{10}\)
\(\displaystyle =\frac{7}{128}\)≒ 0.05469
つまり8回(より珍しいこと)は5%ちょっとの確率で起きます。かなりギリギリの線ですが、まだ帰無仮説を棄却できないくらいです。
ちなみに、一般的に5%未満だと「滅多に起きない」と判断され、実際の仮説検定でも基準を「5%」や「1%」に設定することが多いです。
ということで、今回「帰無仮説は棄却できない(=偶然、という可能性もある。「たろう君がイカサマしてない」という可能性を捨てることができない)」ということになります。
あら…(ギリギリだけど、可能性としてはありうるのね…)。
それみたことか!!
でも、「帰無仮説が棄却できない」=「主張が間違っている(イカサマしてない)」とは言えませんからね。
え?そうなの…?
この場合、帰無仮説が棄却できなかっただけで、「帰無仮説が正しい」か「主張したいことが正しい」かはわかりません。
あくまで、証拠不十分により「主張してることが正しいか正しくないか判断できなかった」という状況です。
有意水準、P値を使ってもう少し詳しく仮説検定を説明
はいはい…あー、アレですね。
ついにやっちゃいましたね。
もうごまかせませんよー。
違うよぅ…濡れ衣だよぅ…
アレ?またやってるんですか?
せんせい!次は確実です!なんてったって9回も表ですからね!絶対なんかやってます!
ぬぅー…違うって言ってるのにー…。
今回も同じように検定をしてみますが、先ほどは省いた用語や手順などを整理しながら少し詳しくやっていきましょう。
「主張したいこと」を否定したものを帰無仮説というのでした。ちなみに「主張したいこと」を対立仮説といいます。本来主張したいことなのに対立、というのもおかしい感じがしますね…。ただ、先ほどの例でわかったと思いますが、帰無仮説についての話が重要なので「帰無仮説に対して対立する仮説」というイメージです。
先ほどの例ではちゃんと基準を設定しませんでしたが、帰無仮説を棄却するかどうか?の基準を有意水準といいます。
また、帰無仮説で実際に計算した値のことをP値といいます。
以上をふまえて、仮説検定の手順は以下のようになります。
- 対立仮説(主張したいこと)を否定した「帰無仮説」を準備する。
- どのくらいで帰無仮説を棄却するか?の基準、有意水準を設定する。大体、5%か1%に設定することが多い。
- 帰無仮説が正しいとして、実際に起きたこと(+それ以上に起こりそうにない事象)がどれだけの確率で起きるか計算する。これで計算した値をP値、という。
- P値が有意水準を下回っていたら帰無仮説を棄却します。「そんなに低い確率であることが起きた、ということは帰無仮説は間違いである、つまり対立仮説(主張したいこと)が正しい、とした方が妥当である」と考えます。
それでは順を追ってやってみましょう!
① 今回は「たろう君はイカサマしている」と主張したいので、これを対立仮説、「たろう君はイカサマをしていない」を帰無仮説とします。
② 有意水準は5%とします。これをP値が下回っていたら(=実際に起きたことが確率として5%よりも低かったら)帰無仮説を棄却します。
③ 実際にP値を計算します。
\(\displaystyle _{10}C_9\left( \frac{1}{2}\right)^9 \left( \frac{1}{2}\right)^1 + \left( \frac{1}{2}\right)^{10}\)
\(\displaystyle =\frac{11}{1024}\)≒ 0.01074
④ 「仮に正しいコインを投げていたとしたら、10回コインを投げて9回以上表が出る確率は1%程度」というのがわかりました。ですので、有意水準5%を下回っています。よって、帰無仮説は棄却され、「たろう君はイカサマを使っていると主張できる合理的な根拠」が得られました。
回りくどい言い方ですが、統計の場合、いつでも「可能性が高いかどうか?」の話になるのでこのような言い回しになっちゃいます。
はい!やっぱりね!数学的にも「イカサマをしている」と言った方が妥当でしょ!罰としてさっきの分もジュースおごりなさいよ!
なんでだよぅ…濡れ衣だよぅ…。(→本当に何もしてない。当然だが、こういう状況になる可能性だって万に一つだが、ありうる。運が良かった(悪かった)だけ。)
おまけ
このやり方は「ほぼ妥当」というだけで、今回のお話のように「絶対合っている」というわけではありません。
最後のように「本当は帰無仮説の方が正しいのに帰無仮説を棄却してしまった」間違いを、第一種の過誤といいます。帰無仮説が正しいのに棄却してしまうと、誤解を生みますね。ですので、帰無仮説を棄却する、というのは慎重に行わなければいけません。
ちなみに、「本当は対立仮説が正しいのに帰無仮説を棄却できなかった」間違いを、第二種の過誤といいます。
例えば、本当はたろう君はズルをしていて、
(まぁ8回くらいならギリ大丈夫だろ)
という目論見で、8回表を出したとすると、
『たろう君はイカサマしてる!』(対立仮説。主張したいこと。)
は正しいのに、最初の例のように帰無仮説を棄却できず、結果「対立仮説が正しいか正しくないか判断しかねる」状況になります。これが第二種の過誤です。
第一種の過誤と第二種の過誤は、有意水準の設定によって起きる可能性が高くなるか、が決まります。
「有意水準を厳しく設定」→第一種の過誤(誤解)は生み出しにくくなるけど、第二種の過誤(見逃し)は生み出しやすくなる。
「有意水準を緩く設定」→第一種の過誤(誤解)は生み出しやすくなるけど、第二種の過誤(見逃し)は生み出しにくくなる。
どれが正しい、とは一概に言えません。あくまで検定を行う人が何を重視して検定するかによると言えます。
まとめ
2022年度からの高校数学、新教育課程から入ってきた「仮説検定」について説明しました。
実は「数学I」では軽くしか触れられておらず、「数学B」統計的な推測、でより詳しく説明します。
今後の高校数学は、この「統計」の扱いをどうするか、がポイントになってきそうです。
正直、今まではほとんど教えてこなかった分野ですが、共通テストや一般入試、自己推薦型や学校推薦型の試験などで「統計」が広く扱われるようになれば、無視できなくなる分野になりそうです。
おまけ
ここからは本文に関係ない宣伝です。
このブログはアフィリエイト(宣伝)に参加しているのですが、アフィリエイトの広告って、結構面白いものがあるんですよね。
中には「なにコレ!欲しい!」と思うようなものもあります。結構アフィリエイトの広告って眺めているだけでも面白いです。
私は結構多趣味でパソコン関係からスポーツ、アウトドア、料理…色々やります。そんな私が、有名なASPサイトである「A8.net」と「もしもアフィリエイト」の広告を全て見て「これは面白いな」と思ったものや、実際に利用しているサービスを紹介していきたいと思います!
ちょっと息抜きに見てみてください!
LINEスタンプ
新着スタンプなど、情報発信していきます。他にも「クマ」に関する情報が共有できたら、と思います!
インスタは結構更新頻度高いです!ちょっとしたマンガも描いてますのでぜひフォローお願いします。
ポイ活
ポイ活は地味にお得なのでコツコツとやってます。買い物したりミニゲームしたりでポイントを稼ぐのが好きな人にはオススメです!
ネットショッピングをよくする、という人にオススメ!いろんなネットショッピングがポイントがつつ対象になってます。結構貯まりますよ。