箱中有 2 顆紅球 3 顆白球。隨機取一球,若為紅球得 10 元獎金,若為白球得 20 元獎金。假使取後放回,連續玩兩次,問獎金期望值為何?若改成取後不放回,又如何?正常的做法可能是像下面這樣:
分成「紅紅、紅白、白紅、白白」四種可能。若取後放回,期望值為 $$20\cdot\frac{2}{5}\cdot\frac{2}{5}+30\cdot\frac{2}{5}\cdot\frac{3}{5}+30\cdot\frac{3}{5}\cdot\frac{2}{5}+40\cdot\frac{3}{5}\cdot\frac{3}{5}=32$$ 若取後不放回,則為 $$20\cdot\frac{2}{5}\cdot\frac{1}{4}+30\cdot\frac{2}{5}\cdot\frac{3}{4}+30\cdot\frac{3}{5}\cdot\frac{2}{4}+40\cdot\frac{3}{5}\cdot\frac{2}{4}=32$$放不放回得到的答案竟然是相同的!這並非巧合。事實上,我們可以把它推廣到下面的一般情形。
定理 箱中有 $m$ 顆紅球 $n$ 顆白球。隨機取一球,若為紅球得 $p$ 元,白球得 $q$ 元。則連續玩 $k$ 次,其中 $k\le m+n$,無論規則是取後放回或取後不放回,所得獎金的期望值皆等於 $$k\left(\frac{pm}{m+n}+\frac{qn}{m+n}\right)$$ (但請注意,「取後放回」或「取後不放回」要先約定好,在整個遊戲過程中一致,不可以有些球放回有些球不放。)注意到 $\frac{pm}{m+n}+\frac{qn}{m+n}$ 其實就是只取一球的獎金期望值。因此上面的定理告訴我們,取 $k$ 球的期望值就是只取一球的期望值乘以 $k$ 倍這麼簡單,無論取後放回或是取後不放回。但是如果按照上面的「正常解法」,分成各種可能,逐一計算再相加,不但複雜,而且很難看出來為什麼會有這樣的結果,只能說算出來剛好一樣,太神奇了!一個比較好的推導方式,是利用期望值是隨機變數的加性函數這件事,詳細如下。
把完成 $k$ 次取球視為一次遊戲。無論採「取後放回」或「取後不放回」,依照規則,玩一次遊戲所得獎金為 $$X = p\times\mbox{總共取得的紅球數}+q\times\mbox{總共取得的白球數}$$ 這個 $X$ 的值會根據我們的遊戲結果而有所不同,因此稱為隨機變數。我們要算的就是 $X$ 的期望值,記作 $E[X]$,但現在我們不使用前面的列式,而是先注意到 $X$ 可以分成各次取球的獎金相加。也就是說 $$X=X_1+X_2+\cdots+ X_k$$其中 $X_i$ 表示第 $i$ 球所得獎金。根據規則, $$X_i=\left\{\begin{array}{lc}p, & \mbox{第 }i\mbox{ 次取得紅球}\\ q, & \mbox{第 }i\mbox{ 次取得白球}\end{array}\right.\quad(i=1,2,\ldots,k)$$ 注意這些 $X_i$ 同樣是我們「取 $k$ 球遊戲」的隨機變數,只不過它的值只取決於第 $i$ 球的結果,而不在意其他球是什麼顏色。由於期望值為隨機變數的加性函數註,因此 $$E[X] = E[X_1]+E[X_2]+\cdots+E[X_k]\tag{1}$$ 這樣,我們只要算出各個 $E[X_i]$ 再相加就可以。這就簡單很多,它的值為 $$ p\cdot (\mbox{第 }i\mbox{ 次取球拿到紅球的機率}) + q\cdot (\mbox{第 }i\mbox{ 次取球拿到白球的機率})$$ 要算這個東西,我們還要利用下面這件事:
如果是取後放回,這是廢話。取後不放回應該也符合直覺......是吧?注意這裡的機率指的是「還沒開始遊戲之前,預估第 $i$ 次會拿到紅/白球的機率」,而不是已經拿完 $i-1$ 球,然後看下一球是紅/白球的機率。這就跟抽籤一樣,在大家都還沒開始抽之前,人人平等。你排第一個抽,或是第十個抽,抽到籤王的機率都一樣。如果對這件事覺得有些疑慮,或單純對這個問題的分析覺得有興趣,可參考〈抽籤的順序重要嗎?〉。總之,這裡我們就直接接受它。因此得到 $$E[X_i]=p\cdot \frac{m}{m+n}+q\cdot\frac{n}{m+n}$$ 這答案對於 $i=1,2,\ldots,k$ 都一樣,代回 (1) 式即推得我們所要的結果。
- 無論是取後放回或取後不放回,第 $i$ 次拿到紅球的機率都是 $\frac{m}{m+n}$,拿到白球的機率都是 $\frac{n}{m+n}$。
註 也就是說針對相同隨機試驗的兩個隨機變數 $X,Y$,$E[X+Y]=E[X]+E[Y]$。由此不難看出有限和的情形 $E[X_1+\cdots+X_k]=E[X_1]+\cdots+E[X_k]$ 亦成立。這不屬於高中課程的範圍,但許多老師會偷用。想了解它為什麼成立,以及知道更多相關的有趣問題,可參考這篇文章。
太棒了!!!
回覆刪除