平均值為什麼被叫做期望值?王贇 Maigo2014-08-01 23:13:13

我感覺這明明是一個語言學問題啊,題主想問的是為什麼期望會起“期望”這麼一個詩意的、反直覺的名字吧?

那些複述定義的、辨析期望與平均值的關係的答案,統統沒有幫助……

“期望值”這個術語是從英文直譯過來的,英文原文叫做expected value。

維基百科對這個詞的解釋是:

In probability theory, the

expected value

(or

expectation

mathematical expectation

EV

mean

, or

first moment

) refers, intuitively, to the value of a random variable one would “expect” to find if one could repeat the random variable process an infinite number of times and take the average of the values obtained。

這裡用了一個英語中的句型“sb expects to do sth”,“期望”也正是來源於這裡的“expect”。

它的意思是,如果你多次實驗(並取平均值),你可以“期望”得到怎樣的一個數。

這個句型在漢語中並不常用,這是“期望”這個名字讓以漢語為母語的人感到奇怪的原因之一。

我覺得翻譯成“預期”會略好一些,但依然不是一個讓人一下子就能懂得內涵的翻譯。

“期望”這個名字反直覺還有另一個原因,這個原因使得即使是以英語為母語的人也會感到反直覺。

The value may not be expected in the ordinary sense—the “expected value” itself may be unlikely or even impossible (such as having 2。5 children)。

即,期望值並不一定是隨機變數可能的取值。

例如,擲一枚均勻的色子,點數的期望值是3。5,但色子並沒有一面上的點數是3。5。

這是因為,即使在第一段引文中,最後還是提到了“取平均”。

而一般人對“期望”的理解是,我只做一次實驗,可以期望得到什麼值。

對於連續且方差較小的分佈,這種理解是可行的。

例如,對於正態分佈N(3, 0。1),我說我隨機取一個樣本,期望它在3左右,是沒有問題的。

數學中“期望”的定義,正是這樣一種樸素的“期望”的推廣;正因為是推廣,所以會出現樸素的理解不適用的情況。

平均值為什麼被叫做期望值?匿名使用者2014-08-03 01:21:52

在機率論和統計學中,一個離散性隨機變數的

期望值

(或

期望值

、或

數學期望

,亦簡稱

均值

,物理學中稱為

期望

)是試驗中每次可能結果的機率乘以其結果的總和。換句話說,

期待值

是隨機試驗在同樣的機會下重複多次的結果計算出的等同“期望”的平均值。需要注意的是,

期望值

並不一定等同於常識中的“期望”——“

期望值

”也許與每一個結果都不相等。(換句話說,

期望值

是該變數輸出值的平均數。

期望值

並不一定包含於變數的輸出值集合裡。)

——WIKI

當重複多次實驗後,得出的實驗結果和機率(樣本資料),能夠對總體資料的分佈得出一個大致的輪廓。

透過以機率作為權數對樣本資料進行加權平均得出的平均數作為期望值,結合標準差,我們可以認為總體分佈就在期望值附近,標準差相當於誤差。

期望值

平均值是處理資料的一種方法。(平均值還有算術平均值、幾何平均值、加權平均值等分類呢)

所以,不存在「平均值被叫做期望值」這種說法。

平均值為什麼被叫做期望值?知乎使用者2014-08-03 03:01:00

均值是平均,期望是估計,一個是常值,一個是極限,即便某些分佈下計算結果一樣,但本質是完全兩碼事兒,叫成一樣是錯誤的,不要混淆了。

比如,古典機率下,無限次丟骰子的均值是3。5,幾個有限次丟骰子實驗後樣本均值顯然是不同的,而樣本均值的期望才是3。5,所謂無偏估計。

平均值為什麼被叫做期望值?周則禹2014-08-04 15:34:03

平均值是對樣本的一個統計量(statistic),是可算的。

期望值是對隨機變數在某個度量中的描述量,是理想化的,被估計的。

大數定理(有很多版本,條件不同,收斂不同):

如果是隨機獨立一致樣本(i。i。d),當樣本足夠大的時候,平均值向期望值收斂。

討論:

如果對樣本i。i。d。有把握,平均值可以作為隨機變數期望值的估計。

期望值是first moment,這種估計法也叫矩法(methods of moments)。在對隨機變數分部不清楚的時候methods of moments很好用,但沒有MLE(maximum likelihood estimator)收斂得快。

正態分佈的first two moments正好和MLE一樣。

當樣本相關性不小的時候,平均值估計出的期望值會有很高的偏差(bias),往往需要修正。

期望估計往往是第一步,對樣本背後變數的真實分部的估計要更復雜。期望值的收斂是一個數的收斂,分部的收斂是函式收斂。正確的函式估計有很多用處,比如做假設檢驗(hypothesis testing)。又比如在保險行業,應對的都是小機率事件。他們對分部在尾部的收斂要求非常高。

ps:統計中文不好,請多包含。

感謝

@七月@niaocu

指正

平均值為什麼被叫做期望值?mahalanobis2014-08-12 01:27:22

我同意

@王贇 Maigo

的觀點,這是一個語言學的問題(我不懂裝懂哈哈)。很多回答對“平均值被叫做期望值”提出質疑,矛盾在於問題中“平均值”描述不清。但是問題中有個關鍵詞

“詞源”,

那麼我的主觀猜測是,題主是想了解統計學中常常聽到描述“均值”時用“期望”這個詞,是什麼緣由。(我改成“均值”、“期望”了,如果還有異議,直接看文末哦。)

為此我重新翻了翻我兩年前初學機率論與數理統計時的教材,果然對書中介紹期望一詞起源的“分賭本”問題有一點印象。“期望”最早追溯到17世紀,法國數學家帕斯卡在一個“分賭本”問題中提出。

問題是:甲、乙兩賭徒,各出50法郎,每局無平局,輸贏機率對半。他們約定,誰先贏三局,則得全部賭本100法郎。當甲贏了二局、乙贏了一局時,因故中止賭博。問這100法郎如何分才算公平?

(1)基於已賭局數來分:甲贏了二局、乙贏了一局。甲得100法郎中的2/3,乙得100法郎中的1/3。

(2)數學家帕斯卡的分法:設想一下賭局又恢復了,兩人繼續賭下去,最多再來兩局必定結束。由於每局的勝負可能性對半,簡單計算便知乙贏得100法郎的機率是1/4,甲贏100法郎的機率是3/4。然後他用我們熟知的機率分佈列描述甲最終所得法郎的數額:

法郎 0 100

機率 1/4 3/4

帕斯卡認為,甲的“期望”所得為0*1/4 + 100*3/4 = 75

甲得到75法郎,乙得到25法郎。

75這個數字裡蘊含了對

繼續賭下去

的一種

期望所得

“期望所得”即隨機變數(或分佈)的均值,帕斯卡叫它期望。

以上是“期望”一詞的來源。

————————————————————————————————————————————

最後,與排名第一的答案有不同的觀點。

我認為下面說法都是合理的

樣本均值;

總體均值;

樣本點的期望;

總體分佈的期望。

樣本在抽取前是隨機變數,隨機變數都有期望。

樣本在抽取後就是一組確定的數值,不談期望只談均值。

標準正態分佈的均值是0。

標準正態分佈的期望是0。

“the mean and variance for a standard normal distribution is 0 and 1”

這個mean我翻譯成均值,關鍵是人家總體分佈也談均值了呀

! \ ^ o ^ /

參考資料:

機率論與數理統計教程 (豆瓣)Probability and Statistics (3rd Edition) (豆瓣)