スポンサーリンク

こんにちは。

今回は、全米そして世界中の数学者の間で議論を巻き起こした

伝説のモンティホール問題と条件付確率について解説します!

モンティホール問題とは、アメリカのテレビ番組の中で出された次のようなものである。
司会者(モンティ)は挑戦者に対しこう告げる。
ここに3つのドアがある。

1つは車があって当たりだが、あと2つにはヤギがいてハズレだ。
まずドアをどれでもいいから1つ選んでもらおう。
Bにする?ならいいかい、選んでない2つのうちヤギがいるドアを開けるよ。
はい、Cにヤギがいた。
ではここであなたはドアをBのままにするか、Aに変更するかどっちにする?

という問題だ。

これは私も引っかかってしまいました。
そしてこの問題に、世界一IQが高い女性が変更したら確率が2倍になるといい、世界中の数学者がそんなことあるはずない、確率は同じだと反論し、大論争となったのです!

さて、どちらが正しいのでしょうか?
結論としてはなんと数学者が間違っていました。
恐るべきIQ世界一の女性の頭の良さ。

一つ言い訳的なことをすると、数学者と言っても専門分野によってかなり違うので
代数学や解析学、幾何学が専門の、つまり統計学が専門ではない数学者は統計学については素人同然の人も結構います。
なので間違ってしまったとも考えられます。

しかし、確率が2倍になるとはいったいどうなっているのでしょうか?
これを簡単にわかりやすく解説していきます。

この問題がなぜわかりにくいのか。

ポイントはドアが3つであとで2つの中から選ばせるというものです。
なんか2つのドアから1つが当たりなんだからどっちも1/2?いいえ違います。
最初は3つありましたよ。これもポイントです。

そしてこのようにわかりにくい問題は極端に考えるのです。

もし、ドアが10000個あったらどうなるでしょうか?考えてみましょう。

まずあなたは10000個のドアの中から1つ選ぶ。この時点で確率は1/10000だ。
そして選んでないドアのうちヤギがいる9998個のドアがすべて開けられていく。

さあ、あなたはドアを変更するだろうか?
答えは変更した方が圧倒的に、というよりほぼ当たりを獲得することができるのだ。

おいおいなんでだよ、、、と思った方!冷静に考えましょう。

その9998個のドアが開いていく過程で1つ飛ばされたドア、つまり開かなかったドアがありました。
それもそのはず、ドアはあなたが選んだドアと、それ以外の1つを残してすべて開けることになっているからです。
ではなぜ開けられなかったのか?それは当たりだったからと考えるのが自然です。

例えば1から10000までの番号が付けられているドアがあってあなたは自分が選んだときの1/10000の確率を信じますか?
それとも残ったドアである可能性を信じますか?答えは明白ですね?

自分が選んだドアはそもそもどう頑張っても確率1/10000なので当たるはずもないので変えた方がよいことになります。
9998個はハズレであることが確定しているので当たりはどちらかにしかありません。
そしてあなたが選んだのは1/10000の確率というとんでもなく低い確率で選んだドアです。
これは変えない理由がないでしょう。これでおわかりいただけましたか?

あなたがドアを変えた場合は最初に自分の選んだドアが当たりの場合のみ外れることになるので
当たる確率は1-1/10000=9999/10000ということになります。

スポンサーリンク

ということはさっきの3つの場合も同様に考えて、自分が選んだドアが当たりの確率=1/3
ドアを変更したときに当たる確率=1-1/3=2/3となります。
そしてドアは2通りからしか選べないので、この2つの確率を足すとちょうど1になってないといけないですがちゃんと1になっていることがすぐわかります。

つまり究極的には自分が選んだドアが当たりかそうでないかの2択でしかないのです。
だから最初に自分が選んだドアが当たりの確率がわかれば、そうでない確率は1から自分が選んだドアが当たりである確率を引けばいいのです。

ではこの問題を応用した条件付確率とベイズの定理の例について見てみましょう。

コロナの検査にPCR検査があるが、特殊なPCR検査をするとコロナにかかっている人は99%が陽性になることがわかっている。
そして99%の人がコロナでないならば陰性になることもわかっている。
さて、Aさんが検査をしたところ陽性であった。
Aさんが実際にコロナにかかっている確率を求めよ。

前提として、検査をする前にコロナにかかっている確率は1%とします。
表を書いてみる。人口を100万人とします。

陽性 陰性 合計

コロナにかかっている 9900 100 10000

コロナではない 9900 980100 990000

合計 19800 980200 1000000

よって陽性の人がコロナにかかっている確率は9900/19800=0.5=50%となります。

私は医師ではありませんので医学的なことはわかりませんがこの検査をする前にコロナにかかっている率=有病率はさきほどは低かったですが、これが濃厚接触者であったり咳やのどの痛み、発熱、息苦しさ(SPO2低下)などがあればコロナにかかっている確率は格段に上がります。
たとえば有病率を10%にしてみましょう。同じように表を作ると以下のようになります。

陽性 陰性 合計

コロナにかかっている 99000 1000 100000

コロナではない 9000 891000 900000

合計 108000 892000 1000000

よってコロナにかかっている確率は99000/108000=91.67%となります。
有病率によってここまでコロナである確率が上がりました。
90%なら陽性=ほぼコロナと言っても過言ではありません。

別のやり方で解いてみましょう。つまり、ベイズの定理を使って解く方法です。
ベイズの定理は以下のようになります。

検査で陽性になる事象をA、検査で陰性になる事象をA^C、実際に病気にかかっている事象をB1、病気にかかっていない事象をB2とします。
ベイズの定理を使うと求める確率はP(B1|A)となります。これはA、つまり陽性という前提のもとでB1が起きた、つまり病気だったという確率です。

P(B1|A)=P(B1)*P(A|B1)/P(B1)*P(A|B1)+P(B2)*P(A|B2)

P(B1)=P(病気にかかっている確率)=0.1

P(A|B1)=P(病気であって陽性)=0.99

P(B2)=0.9

P(A|B2)=P(病気でないのに陽性)=1-P(病気でなくて陰性)=1-0.99=0.01
P(B1|A)=0.1*0.99/0.1*0.99+0.9*0.01=0.099/0.099+0.009=0.9167・・・=91.67%

いかがだったでしょうか?
直観に反するモンティホール問題、そしてコロナ禍にあって皆さんがよく耳にしていた、あのPCR検査のカラクリについて理解できましたでしょうか?

今回は以上になります!ありがとうございました!

参考文献

[1] 精度99%の検査で陽性だったら、その病気である確率は99%??・・・大間違い!

スポンサーリンク