IT系フリーランスの日記

大まかにIT系と呼ばれる仕事を自営業として営んでいる者の日記です

モンティホール問題 その1 概要編

かなり昔のことになりますが、モンティホールジレンマという言葉を聞いたことがありました。
なんだかその時はその時でちらっと見ただけで理解したような気になってしまっていて、そのままかなりの年月が過ぎました。
確か6~7年以上前の事だったでしょうか。

先日スクーウェブキャンパスというオンライン講座のサイトでベイズ統計の授業を見ていたときに、ふと思い出したのがこのモンティホールジレンマ。
オンライン授業といっても録画済みのものだったので、そのまま再生をストップしてWikipediaモンティホール問題を読んだのですが、これはこれは・・・・考え込んでしまいました。

f:id:tyusuke88:20161003182542p:plain

「プレーヤーの前に閉まった3つのドアがあって、1つのドアの後ろには景品の新車が、2つのドアの後ろには、はずれを意味するヤギがいる。プレーヤーは新車のドアを当てると新車がもらえる。プレーヤーが1つのドアを選択した後、司会のモンティが残りのドアのうちヤギがいるドアを開けてヤギを見せる。
ここでプレーヤーは、最初に選んだドアを、残っている開けられていないドアに変更してもよいと言われる。プレーヤーはドアを変更すべきだろうか?」

f:id:tyusuke88:20161003182652p:plain

この問題に、「マリリン・ボス・サヴァント」という女性が回答し、その回答が大論争を巻き起こした、というものです。

1990年9月9日発行、ニュース雑誌 Parade にて、マリリン・ボス・サヴァントが連載するコラム欄「マリリンにおまかせ」において上記の読者投稿による質問に「正解は『ドアを変更する』である。なぜなら、ドアを変更した場合には景品を当てる確率が2倍になるからだ」と回答した。すると直後から、読者からの「彼女の解答は間違っている」との約1万通の投書が殺到し、本問題は大議論に発展した。

さらに興味深いのが、この問題のややこしさを象徴することもありますが、寄せられた投書1万通のうち、およそ1000人が数学の博士号保持者だったというところ。

再度、彼女の答えを整理すると、

プレーヤーが最初に選んだドアをそのまま開ければ当たりである新車を獲得する確率は1/3。
だが司会者の残したドアに変更した場合、当たりの新車を獲得する確率は2倍に跳ね上がる。

というものです。

普通に考えれば、司会者はヤギのいるはずれのドアを開けて「選択肢を1つつぶしている」訳なので、この時点で当たりになるドアは2つのうちどちらかになるはず。

であれば、プレーヤーはここで再度、「最初に選んだドアをそのまま開ける」か、「もう一つのドアを開けるか」の選択を与えられても、賞品を当てる確率は、
2つある選択肢のうち、1つがはずれ、もう1つが当たりですので。。。。
どう考えても1/2になりそうに思えますよね。

でもまぁ、違うわけです。

ここで、この問題について初見で、かつ「え?そのままだと3/1で変えたら1/2でしょ?」と思った方がいたら教えて下さい(笑)

正直打ち明けて、このWikipediaのサイトを読んで4時間以上パソコンの前で固まってしまいました(笑)

まあ、最終的には説明を読んで納得しましたが、こんな危険な問題が存在するなんて・・・

なぜ彼女が指摘したような結果になるか、説明をするには1日分のブログはあまりに短いのでこのお話は後々また順を追って説明していきます。

個人的に面白いと感じたのは、論争の経緯。


彼女の説明に対して、

ジョージ・メイソン大学 ロバート・サッチス博士「プロの数学者として、一般大衆の数学的知識の低さを憂慮する。自らの間違いを認める事で現状が改善されます」

ず、随分と上からいいますねw。まずは自らの過ちを認めることから始めましょうって事ですね。まあ誤っていたのは彼の方でしたが・・・

また、

フロリダ大学 スコット・スミス博士「君は明らかなヘマをした(中略)世界最高の知能指数保有者自らが数学的無知をこれ以上世間に広める愚行を直ちに止め、恥を知るように!」

彼の話しによると、マリリンは恥を知らなくてはならないようです。

しかしながら、

アンドリュー・ヴァージョニがモンティーホールジレンマをモンテカルロ法を使って自前のパーソナルコンピュータで数百回のシミュレーションを行うと、結果はサヴァントの答えと一致。ポール・エルデシュは「あり得ない」と主張していたがヴァージョニがコンピューターで弾き出した答えを見せられサヴァントが正しかったと認める。

そして・・・

エルデシュはこの問題の解答を最初に間違いだと断定、立腹して外出する。一時間程経過してから帰って来るはずの時間ではないエルデシュがカンカンに怒って帰ってきてこの問題(と解)をエルデシュに教えた弟子を「君はなぜ選択を変更するのか言ってくれなかった!どうして言わなかったのか!」といらだった様子で問い詰める。これには弟子も説明が出来ず師に謝罪。エルデシュは益々不機嫌になったという。

一応高名な数学者の名誉を守るために付け加えるなら、彼が「勘違い」をしたのには訳がありました。それはこの問題の前提が100%説明され尽くしていなかったということ。
この件はまた次の機会に譲ります。

ちなみに、この「アンドリュー・ヴァージョニ」がどんな人なのか分からないのですが、モンテカルロ法というは目の付け所としては悪くない訳で、そして、恐らく目の付け所として悪くなかったからこそ、ポール・エルデシュもシミュレーションの計算結果とプログラムコードを見て(見たはずです。そうでなければ適当な結果を表示しているかもしれませんし、なんの意味ある説明にもなりません)サヴァントが正しかったと認めたのでしょう。

そこでアンドリュー・ヴァージョニさんが書いたコードがどのようなものか知りたかったのですが、知る手立てがなく、この機会にこの問題をモンテカルロ法を使ったシミュレーションでそれぞれ
「プレーヤーが選択を変更しなかった場合」と「変更した場合」に分けて、10万回のシミュレーションを行い、それぞれの当選率を調べて見ました。
10万回という回数に特に意味はありませんが、回数が多ければ多いほど対数の法則に基づき正確な確率に収束していくだろうこと、
そして1990年代のパーソナルコンピューターでは計算速度の問題から数百回で納めていたかも知れませんが、せっかく計算速度のが進歩したのですから回数を増やして見てもいいかな、と思ったためです。
このシミュレーションは、私の古いパソコンでも1分とかからず終了しました。

ご覧になったり、ご自身のPC上でシミュレーションをしてみたい方は、Eclipseがあれば実行できますので、以下を参照して下さい。

github.com


結果は、

選択を変えてドアを選びプレイヤーが景品の入ったドアを開けた回数=66470回
選択を変えずにドアを選びプレイヤーが景品の入ったドアを開けた回数=33174回
選択を変えてドアを選びプレイヤーが景品の入ったドアを開けた率=66.47%
選択を変えずにドアを選びプレイヤーが景品の入ったドアを開けた率=33.174%

おお、モンテカルロ法を使ったシミュレーションでも確かにプレーヤーが最初に選んだドアをそのまま開けた場合は1/3(≒33.174%)、変更した場合は1/3(≒66.47%)で理論通りになりました。

このお題については、詳しい話しをまた後日にでも・・・