機率分佈函式的深層次意義是什麼?
我從應用方面著手吧。當我們編寫模擬程式的時候,我們常常要做隨機抽樣。因為電腦給出的通常是介乎0與1之間的浮點數,當我們想要的密度函式不是均勻(uniform distribution)的話,機率分佈函式(cumulative probability function)便顯得重要。
如果抽樣的機率函式是均勻的,即
,那
,那電腦給出的隨機數
便可當作
直接輸出。
但如果不是的話,那我們便要用機率分佈函式求出
用作輸出。例如,如果
,那
,電腦給出r,那
。
有些分佈沒有數式,那就有點麻煩。如Poisson distribution,你要真的逐項加起硬計找出輸出的
。
總結來說,電腦給出
(
),然後抽樣的輸出便是
,當中
是機率分佈函式
的反函式。
隨機變數
的引入,使我們能用實數來描述各種隨機現象的結果,但隨機變數和普通函式之間還是有著本質的區別,不能運用我們已有的手段處理它;
而
分佈函式
是一個普通函式,正是透過它,我們將能利用數學分析的方法對隨機試驗的結果進行深入廣泛的研究;
實際應用
是要和理論接軌的,所以理論上是用分佈函式來研究的,實際應用也是在用分佈函式做,事實證明這樣做確實好。
分佈函式體現了在隨機變數X的各種取值中,用機率描述x這個數的位置(大小而言),即隨機變數各種取值中,x是有多大,什麼層次。
分佈密度體現了x這個位置是什麼情況(附近的點有多少等等)
對於離散型隨機變數來說,其實最常用的是分佈列,也就是每個點的機率組成的集合。機率分佈函式其實是不常用的。
對於連續性隨機變數來說,由於每個點的機率都是0,所以我們往往想知道的隨機變數在一個區間
上發生的機率。如果僅僅知道機率密度函式
的話,那麼每次都要透過計算積分
才行。那麼不如我們事先計算出機率分佈函式
,當我們想計算某個區間的機率時,直接用
就能快速計算出這個區間發生的機率了,比計算積分要簡單。
分佈函式是先有的
每個右連續單調增-∞取0+∞取1的函式都可以定義分佈函式,但是
密度函式不是一定有的!
比如離散機率測度就沒有密度函式
比如奇異測度用幾乎處處導數無法還原出原始的分佈函式
總結來說就是lebesgue-radon-nikodym定理:dP=dλ+fdμ,你不能把dλ這個奇異部分給漏掉!