這一部分主要針對課本前兩章進行題目和例項的補充, 並夾雜一部分知識點。

首先我們來看幾個古典概型的問題。

例題2.1

m

個男孩和

n

個女孩隨機地沿圓桌坐下, 試問任意兩個女孩都不相鄰的機率。

圓排列和插空法。 熟悉排列組合中的各種已知結果並熟練運用乘法原理和加法原理。

解答

取樣本空間

\Omega

為所有的坐法, 顯然

\quad |\Omega|=\frac{(m+n)!}{m+n}=(m+n-1)!

不妨設此事件為

A

, 顯然當

m<n

A=\varnothing

從而

P(A)=0

m\geq n

時, 考慮先讓所有男孩坐下, 有

(m-1)!

種坐法, 這些男孩之間有

m

個空位來安插未落座的

n

個女孩, 因此易得女孩的坐法有

\binom{m}{n}n!

種, 從而事件

A

中共有

(m-1)!\cdot\binom{m}{n}n!

個樣本點, 因此

\quad P(A)=\frac{(m-1)!\cdot\binom{m}{n}n!}{(m+n-1)!}=\frac{\binom{m}{n}}{\binom{m+n-1}{n}}

例題2.2

從對稱群

S_n

中任取一個置換, 這個置換恰有

k

個不動點的機率

p_k

是多少(

0\leq k\leq n

)?

這個問題是從課本第一章習題第35題抽象而來。 關鍵是容斥原理的運用。

解答

樣本空間可以直接取

S_n

, 其中有

n!

個樣本點。

我們先來考察

k=0

的情況。 設

\quad A_i=\{\sigma\in S_n:\sigma(i)=i\}

則由容斥原理

\quad \left|\bigcup_{i=1}^{n}A_i\right|=\sum_{i=1}^{n}(-1)^{i-1}\binom{n}{i}(n-i)!=\sum_{i=1}^{n}\frac{(-1)^{i-1}n!}{i!}

從而

\quad \left|\bigcap_{i=1}^{n}\overline{A_i}\right|=n!+\sum_{i=1}^{n}\frac{(-1)^{i}n!}{i!}

於是

\quad p_0=\frac{n!+\sum_{i=1}^{n}\frac{(-1)^{i}n!}{i!}}{n!}=\sum_{i=0}^{n}\frac{(-1)^{i}}{i!}

對於一般的情況, 利用上面所得可知, 從

S_n

中取一個置換有給定的

k

個點(

\binom{n}{k}

種選法)為不動點而另外

n-k

個點不是不動點的情況有

\sum_{i=0}^{n-k}\frac{(-1)^{i}(n-k)!}{i!}

種, 因此

\quad p_k=\frac{\binom{n}{k}\sum_{i=0}^{n-k}\frac{(-1)^{i}(n-k)!}{i!}}{n!}=k!\sum_{i=0}^{n-k}\frac{(-1)^{i}}{i!}

*例題2.3

利用機率論的想法證明對正整數

A

a

, 若

A>a

\quad1+\sum_{j=0}^{A-a}\prod_{i=0}^{j}\frac{A-a-i}{A-1-i}=\frac{A}{a}

該題取自課本第一章習題第32題, 這類問題要求解題者積累了足夠多的做題經驗, 才能從一個式子的外形看出什麼樣的事件機率計算能套用, 個人覺得不太可能作為期末考試題出現。

解答

設袋中有

A

個球, 其中

a

個是白球, 其餘為黑球。 現在不放回地從袋中逐個取球, 記第

k

次才首次取得白球的機率為

p_k

, 顯然

\sum_{k=1}^{A}p_k=1

, 且易得

\quad p_1=\frac{a}{A}

2\leq k\leq A-a

\quad p_k=\frac{a}{A}\prod_{i=0}^{k-2}\frac{A-a-i}{A-1-i}

A-a< k

p_k=0

於是有

\quad\frac{a}{A}+\sum_{k=1}^{A}\frac{a}{A}\prod_{i=0}^{k-2}\frac{A-a-i}{A-1-i}=1

稍作整理即得要證等式。

接下來看一道經典的幾何概型的問題(我記得在高中課本上是例題)。

例題2.4

甲和乙約定明天早上七點到八點在某地會面, 假設兩人到達的時刻是(七點到八點之間)隨機的, 試求第二天出現其中一人需要等待另一人半小時以上的機率。

解答

設甲和乙到達的時刻是

7+x

7+y

(單位: 時), 可取樣本空間為

\quad\Omega=\{(x,y):0\leq x,y\leq1\}

這是一個單位正方形。 其中一人需要等待另一人半小時以上可以描述為事件

\quad A=\{(x,y):|x-y|>\frac{1}{2}\}

於是可知結果為

\quad P(A|\Omega)=\frac{m(A\cap \Omega)}{m(\Omega)}=\frac{1}{4}

然後我們看一下, 看似平凡的全機率公式和貝葉斯公式在具體問題中的應用。

例題2.5

設一個家庭有

n

個孩子的機率為

\quad p_n=\begin{cases}ap^n&n\geq1\\[2ex] 1-\frac{ap}{1-p}&n=0\\ \end{cases}

其中

p\in(0,1)

a\in(0,\frac{1-p}{p})

。 若認為生一個小孩的性別是(男女)隨機的, 試求一個家庭有

k

k\geq1

)個男孩的機率。

值得注意的是這裡需要求一個級數的和。

解答

A_n

表示事件“家庭中有

n

個孩子”,

B_k

表示事件“家庭中有

k

個男孩”, 由全機率公式

\quad\begin{align} P(B_k)&=\sum_{n=k}^{\infty}P(A_n)P(B_k|A_n)\\[2ex]&=\sum_{i=k}^{\infty}p_n\cdot\binom{n}{k}(\frac{1}{2})^n\\[2ex]&=a\sum_{i=k}^{\infty}\binom{n}{k}(\frac{p}{2})^n \end{align}

熟知的結果是

\quad \sum_{i=k}^{\infty}\binom{n}{k}x^n=\frac{x^k}{(1-x)^{k+1}}

(這個結果可以利用形式冪級數

\sum_{n=1}^{\infty}x^n

k

階導數得到)

因此易得

P(B_k)=\frac{2ap^k}{(2-p)^{k+1}}

例題2.6

有一種疾病

S

在一般人群種的發病率為0。005, 有一種檢測

S

的手段準確率為0。98, 即如果某人患有

S

, 則檢測結果認為此人患有

S

的機率為0。98; 但該檢測手段誤將未患有

S

的人誤判為患有

S

的機率為0。05。 現有一人經過該檢測手段後的檢測結果認為此人患有

S

, 試求此人真正患有

S

的機率。

利用貝葉斯公式。

解答

A

表示患有

S

B

表示檢測結果為患有

S

, 我們要求的就是

P(A|B)

由貝葉斯公式和全機率公式易得

\quad P(A|B)=\frac{P(B|A)P(A)}{P(B|A)P(A)+P(B|\overline{A})P(\overline{A})}

根據題意

P(A)

就是發病率0。005,

P(B|A)

就是檢測準確率0。98,

P(B|\overline{A})

等於0。05, 從而可以算得

\quad P(A|B)=\frac{0.0049}{0.0049+0.04975}\approx0.0897

註記

也就是說, 即使檢測準確率高達0。98, 此人真正患有

S

的機率不足0。1, 這是因為在一般人群中此病的發病率相對來說太低了, 要使

P(A|B)>0.5

也至少需要檢測準確率高於0。995。

例題2.7

甲、乙兩個袋中各裝有一黑一白兩個球, 每次操作從兩袋中各取一球放入另一袋中, 用

a_n

表示

n

次操作後甲中白球的數量, 求

a_n=2

的機率。

提取資訊建立遞推公式, 這類問題還是很常見的, 比如直線上的隨機遊走問題就是這麼做的。 值得注意的是對給定的正整數

n

a_n

是一個隨機變數。

解答

分別用

p_n

q_n

r_n

表示

a_n=2,1,0

的機率, 顯然

\quad p_0=r_0=0

q_0=1

利用全機率公式易得

\quad\begin{cases} p_{n+1}=0\cdot p_n+\frac{1}{4}\cdot q_n+0\cdot r_n\\[2ex] q_{n+1}=1\cdot p_n+\frac{1}{2}\cdot q_n+1\cdot r_n\\[2ex] r_{n+1}=0\cdot p_n+\frac{1}{4}\cdot q_n+0\cdot r_n\\[2ex] \end{cases}

可能下面這種表達方式更加直觀:

\begin{pmatrix}   p_{n+1}\\  q_{n+1}\\  r_{n+1}\\ \end{pmatrix}=\begin{pmatrix}  0&\frac{1}{4}&0\\ 1&\frac{1}{2}&1\\  0&\frac{1}{4}&0\\ \end{pmatrix}\begin{pmatrix}   p_{n}\\  q_{n}\\  r_{n}\\ \end{pmatrix}

於是

\begin{pmatrix}   p_{n}\\  q_{n}\\  r_{n}\\ \end{pmatrix}=\begin{pmatrix}  0&\frac{1}{4}&0\\ 1&\frac{1}{2}&1\\  0&\frac{1}{4}&0\\ \end{pmatrix}^n\begin{pmatrix}   0\\  1\\  0\\ \end{pmatrix}

稍作計算即得

\quad p_n=\frac{1}{6}\left[1+(-\frac{1}{2})^{n+1}\right]

下面是一個有意思的不等式。

例題2.8

A

B

是同一機率空間的事件, 證明

\quad|P(AB)-P(A)P(B)|\leq\frac{1}{4}

解答

a=P(A)

b=P(B)

, 不妨設

a\geq b

考慮到

AB\subseteq A

, 因此

P(AB)\leq a

, 於是

\quad\begin{align} P(AB)-P(A)P(B)&\leq a-ab\\[2ex]&\leq a-a^2\\[2ex]&\leq\frac{1}{4} \end{align}

同理

 P(\overline{A}B)-P(\overline{A})P(B)\leq\frac{1}{4}

但注意到

\quad\begin{align} P(\overline{A}B)-P(\overline{A})P(B)&=[P(B)-P(AB)]-[1-P(A)]P(B)\\[2ex]&=P(A)P(B)-P(AB) \end{align}

因此即有

 P(AB)-P(A)P(B)\leq\frac{1}{4}

綜上

|P(AB)-P(A)P(B)|\leq\frac{1}{4}

容易看到等號成立的條件是

A=B

a=b=\frac{1}{2}

, 或者

\overline{A}=B

a=b=\frac{1}{2}

註記

似乎可以進一步考慮

|P(A_1···A_n)-P(A_1)···P(A_n)|

的最大值。

最後我們來看二項分佈的泊松逼近。 這裡先簡略地提一下泊松逼近。

一個在試驗

E

中發生機率為

p

的事件

A

n

次獨立重複試驗

E^n

中發生

k

次的機率為

\quad b(k;n,p)=\binom{n}{k}p^k(1-p)^{n-k}

這種型別的問題是比較常見的, 滿足

P(\xi=k)=b(k;n,p)

的離散型隨機變數

\xi

通常稱為服從

二項分佈

B(n,p)

。 在具體計算中當

p

特別小或者

n

特別大時, 上面式子的計算是比較繁瑣的, 所謂泊松逼近說的是用

\quad p(k;\lambda)=\frac{\lambda^k}{k!}e^{-\lambda}

逼近, 值得注意的是上式亦有相當重要的機率意義, 滿足

P(\xi=k)=p(k;\lambda)

的離散型隨機變數

\xi

通常稱為服從

泊松分佈

P(\lambda)

。 關於泊松分佈的機率意義, 可以看課本pp105-pp109(

必看!

), 圍繞這一點出題也不是不可以。

具體的操作是, 當

p

較小且

n

較大時, 有

\quad b(k;n,p)\approx p(k;np)

其理論依據為

\quad \lim_{n \rightarrow \infty}np_n=\lambda\Rightarrow\lim_{n \rightarrow \infty}{b(k;n,p_n)}=p(k;\lambda)

例題2.9

設有200人都在2000年(閏年)出生, 計算時視每個人的出生日期是隨機的, 試估計這兩百人當中至少有兩人在2月29日生日的機率。

解答

設一百人中恰有

k

人在2月29日生日的機率為

p_k

, 易得

\quad p_k=b(k;200,\frac{1}{366})

這一百人當中至少有兩人在2月29日生日的機率應為

\quad p=1-p_0-p_1

考慮到

\quad b(k;200,\frac{1}{366})\approx p(k;\frac{100}{183})

因此

\quad p\approx 1-\frac{283}{183}e^{-\frac{100}{183}}

查表可知

e^{-\frac{100}{183}}=0.57900...

, 故

\quad p\approx0.1046

直接計算

p

的準確值, 精確到4位小數時是

0.1044

, 與估計值相差不到0。2%。

*例題2.10

在實際生活中, 一個路口一段時間

t

內透過的人的數量

\xi

的機率可以近似地認為是服從泊松分佈

P(\lambda t)

。 若在1分鐘內無人透過的機率為0。2, 試求2分鐘內至少有2人透過的機率。

根據條件求出引數

\lambda

即可。

解答

p(0;\lambda)=0.2

意味著引數

\lambda=\ln 5

, 欲求事件的機率為

1-p(0;2\lambda)-p(1;2\lambda)=\frac{24-2\ln 5}{25}

上面的十個例題應該是儘可能地涵蓋了前兩章的基本內容和解題方法了, 如果有不足歡迎指出。 (個人認為機率論多刷刷題對於不論對於應試還是對於知識的理解都是有益的)還有知乎最近的公式顯示錯誤還是時常發生, 打算去適應一下Zhihu on VSCode了。