|
【周則禹的回答(52票)】: 平均值是對(duì)樣本的一個(gè)描述量(statstic),是可算的。 期望值是對(duì)隨機(jī)變量在某個(gè)度量中的描述量,是理想化的,被估計(jì)的。 大數(shù)定理(有很多版本,條件不同,收斂不同): 如果是隨機(jī)獨(dú)立一致樣本(i.i.d),當(dāng)樣本足夠大的時(shí)候,平均值向期望值收斂。 討論: 如果對(duì)樣本i.i.d.有把握,平均值可以作為隨機(jī)變量期望值的估計(jì)。 期望值是first moment,這種估計(jì)法也叫methods of moments。在對(duì)隨機(jī)變量分部不清楚的時(shí)候methods of moments很好用,但沒(méi)有MLE(maximum likelihood estimator)收斂得快。 正態(tài)分布的first two moments正好和MLE一樣。 當(dāng)樣本相關(guān)性不小的時(shí)候,平均值估計(jì)出的期望值會(huì)有很高的偏差(bias),往往需要修正。 期望估計(jì)往往是第一步,對(duì)樣本背后變量的真實(shí)分部的估計(jì)要更復(fù)雜。期望值的收斂是一個(gè)數(shù)的收斂,分部的收斂是函數(shù)收斂。正確的函數(shù)估計(jì)有很多用處,比如做假設(shè)檢定(hypothesis testing)。又比如在保險(xiǎn)行業(yè),應(yīng)對(duì)的都是小概率事件。他們對(duì)分部在尾部的收斂要求非常高。 ps:統(tǒng)計(jì)中文不好,請(qǐng)多包含。 【mahalanobis的回答(4票)】: 我同意 @王赟 Maigo 的觀點(diǎn),這是一個(gè)語(yǔ)言學(xué)的問(wèn)題(我不懂裝懂哈哈)。很多回答對(duì)“平均值被叫做期望值”提出質(zhì)疑,矛盾在于問(wèn)題中“平均值”描述不清。但是問(wèn)題中有個(gè)關(guān)鍵詞“詞源”,那么我的主觀猜測(cè)是,題主是想了解統(tǒng)計(jì)學(xué)中常常聽(tīng)到描述“均值”時(shí)用“期望”這個(gè)詞,是什么緣由。(我改成“均值”、“期望”了,如果還有異議,直接看文末哦。) 為此我重新翻了翻我兩年前初學(xué)概率論與數(shù)理統(tǒng)計(jì)時(shí)的教材,果然對(duì)書(shū)中介紹期望一詞起源的“分賭本”問(wèn)題有一點(diǎn)印象?!捌谕弊钤缱匪莸?7世紀(jì),法國(guó)數(shù)學(xué)家帕斯卡在一個(gè)“分賭本”問(wèn)題中提出。 問(wèn)題是:甲、乙兩賭徒,各出50法郎,每局無(wú)平局,輸贏概率對(duì)半。他們約定,誰(shuí)先贏三局,則得全部賭本100法郎。當(dāng)甲贏了二局、乙贏了一局時(shí),因故中止賭博。問(wèn)這100法郎如何分才算公平? (1)基于已賭局?jǐn)?shù)來(lái)分:甲贏了二局、乙贏了一局。甲得100法郎中的2/3,乙得100法郎中的1/3。 (2)數(shù)學(xué)家帕斯卡的分法:設(shè)想一下賭局又恢復(fù)了,兩人繼續(xù)賭下去,最多再來(lái)兩局必定結(jié)束。由于每局的勝負(fù)可能性對(duì)半,簡(jiǎn)單計(jì)算便知乙贏得100法郎的概率是1/4,甲贏100法郎的概率是3/4。然后他用我們熟知的概率分布列描述甲最終所得法郎的數(shù)額: 法郎 0 100 概率 1/4 3/4 帕斯卡認(rèn)為,甲的“期望”所得為0*1/4 + 100*3/4 = 75 甲得到75法郎,乙得到25法郎。 75這個(gè)數(shù)字里蘊(yùn)含了對(duì)繼續(xù)賭下去的一種期望所得。 “期望所得”即隨機(jī)變量(或分布)的均值,帕斯卡叫它期望。 以上是“期望”一詞的來(lái)源。 -------------------------------------------------------------------------------------- 最后,與排名第一的答案有不同的觀點(diǎn)。 我認(rèn)為下面說(shuō)法都是合理的 樣本均值; 總體均值; 樣本點(diǎn)的期望; 總體分布的期望。 樣本在抽取前是隨機(jī)變量,隨機(jī)變量都有期望。 樣本在抽取后就是一組確定的數(shù)值,不談期望只談均值。 標(biāo)準(zhǔn)正態(tài)分布的均值是0。 標(biāo)準(zhǔn)正態(tài)分布的期望是0。 “the mean and variance for a standard normal distribution is 0 and 1” 這個(gè)mean我翻譯成均值,關(guān)鍵是人家總體分布也談均值了呀 ! ^ o ^ / 參考資料: 概率論與數(shù)理統(tǒng)計(jì)教程 (豆瓣) Probability and Statistics (3rd Edition) (豆瓣) 【王然的回答(68票)】: 平均值是對(duì)樣本而言,期望是對(duì)總體而言。本就是不同的東西。 多說(shuō)幾句, 平均值Mean是個(gè)統(tǒng)計(jì)量,只能基于一個(gè)樣本而言。而expected value是總體參數(shù), 是隨機(jī)變量在一個(gè)概率測(cè)度下的性質(zhì)。這個(gè)是本質(zhì)的區(qū)別。大數(shù)定理只是平均值依概率收斂于期望,不代表樣本均值和隨機(jī)變量的期望相同。 【王赟Maigo的回答(43票)】: 我感覺(jué)這明明是一個(gè)語(yǔ)言學(xué)問(wèn)題啊,題主想問(wèn)的是為什么期望會(huì)起“期望”這么一個(gè)詩(shī)意的、反直覺(jué)的名字吧? 那些復(fù)述定義的、辨析期望與平均值的關(guān)系的答案,統(tǒng)統(tǒng)沒(méi)有幫助…… “期望值”這個(gè)術(shù)語(yǔ)是從英文直譯過(guò)來(lái)的,英文原文叫做expected value。 維基百科對(duì)這個(gè)詞的解釋是: In probability theory, the expected value (or expectation, mathematical expectation, EV, mean, or first moment) refers, intuitively, to the value of a random variable one would "expect" to find if one could repeat the random variable process an infinite number of times and take the average of the values obtained.這里用了一個(gè)英語(yǔ)中的句型“sb expects to do sth”,“期望”也正是來(lái)源于這里的“expect”。 它的意思是,如果你多次實(shí)驗(yàn)(并取平均值),你可以“期望”得到怎樣的一個(gè)數(shù)。 這個(gè)句型在漢語(yǔ)中并不常用,這是“期望”這個(gè)名字讓以漢語(yǔ)為母語(yǔ)的人感到奇怪的原因之一。 我覺(jué)得翻譯成“預(yù)期”會(huì)略好一些,但依然不是一個(gè)讓人一下子就能懂得內(nèi)涵的翻譯。 “期望”這個(gè)名字反直覺(jué)還有另一個(gè)原因,這個(gè)原因使得即使是以英語(yǔ)為母語(yǔ)的人也會(huì)感到反直覺(jué)。 The value may not be expected in the ordinary sense—the "expected value" itself may be unlikely or even impossible (such as having 2.5 children).即,期望值并不一定是隨機(jī)變量可能的取值。 例如,擲一枚均勻的色子,點(diǎn)數(shù)的期望值是3.5,但色子并沒(méi)有一面上的點(diǎn)數(shù)是3.5。 這是因?yàn)?,即使在第一段引文中,最后還是提到了“取平均”。 而一般人對(duì)“期望”的理解是,我只做一次實(shí)驗(yàn),可以期望得到什么值。 對(duì)于連續(xù)且方差較小的分布,這種理解是可行的。 例如,對(duì)于正態(tài)分布N(3, 0.1),我說(shuō)我隨機(jī)取一個(gè)樣本,期望它在3左右,是沒(méi)有問(wèn)題的。 數(shù)學(xué)中“期望”的定義,正是這樣一種樸素的“期望”的推廣;正因?yàn)槭峭茝V,所以會(huì)出現(xiàn)樸素的理解不適用的情況。 【茉茉的回答(11票)】: 謝。 這個(gè)問(wèn)題的產(chǎn)生還是因?yàn)楦拍畈磺逦?/p> 說(shuō)正題前先提一下:像有一位知友說(shuō)的那樣,平均值有很多種。不過(guò)我猜題主想問(wèn)的是 arithmetic mean,所以其他我們先不說(shuō)。 在建議題主重新去看期望的定義之前,不如先思考下這三個(gè)問(wèn)題: 什麼是期望?所謂期望,它是什麼東西的期望?期望可以傳達(dá)怎樣的信息? 第一個(gè)問(wèn)號(hào): 期望是一個(gè)考量某一隨機(jī)變量 X 的概率分布密度函數(shù)重心的概念。換句話說(shuō),它是 X 在「中間位置」能取到的值。 第二個(gè)問(wèn)號(hào): 期望說(shuō)的是一個(gè)隨機(jī)變量的期望,但因?yàn)楦鶕?jù)期望的定義、我們通常通過(guò)隨機(jī)變量的概率分布密度函數(shù)來(lái)考察期望,所以我們有時(shí)候也會(huì)說(shuō)「一個(gè)概率分布的期望」或者更簡(jiǎn)單的「一個(gè)分布的期望」。 第三個(gè)問(wèn)號(hào): 既然期望是一個(gè)有關(guān)隨機(jī)變量概率分布的重心的概念,那麼它傳達(dá)給我們的信息就是一組數(shù)據(jù)中最中央那個(gè)位置的值(請(qǐng)注意由於隨機(jī)變量也可以是多維的,這裡的表述沒(méi)有使用「數(shù)」)。若以圖形描述,密度函數(shù)的峰值對(duì)應(yīng)的就是這個(gè)分布的期望。 這時(shí)候再回到期望的兩個(gè)定義:離散和連續(xù)兩種情況分別對(duì)應(yīng)的是 x·f(x) 的極限和積分。想想為什麼是這樣的定義;為什麼是 x·f(x),為什麼是極限或者積分。 我想,上面的這些對(duì)讓題主理清概念的幫助要比直接說(shuō) A 是何 B 是何更有意義些。 【astroyao的回答(0票)】: 均值是平均,期望是估計(jì),一個(gè)是常值,一個(gè)是極限,即便某些分布下計(jì)算結(jié)果一樣,但本質(zhì)是完全兩碼事兒,叫成一樣是錯(cuò)誤的,不要混淆了。 比如,古典概率下,無(wú)限次丟骰子的均值是3.5,幾個(gè)有限次丟骰子實(shí)驗(yàn)后樣本均值顯然是不同的,而樣本均值的期望才是3.5,所謂無(wú)偏估計(jì)。 【林承宏的回答(2票)】: 在概率論和統(tǒng)計(jì)學(xué)中,一個(gè)離散性隨機(jī)變量的期望值(或數(shù)學(xué)期望、或均值,亦簡(jiǎn)稱(chēng)期望,物理學(xué)中稱(chēng)為期待值)是試驗(yàn)中每次可能結(jié)果的概率乘以其結(jié)果的總和。換句話說(shuō),期望值是隨機(jī)試驗(yàn)在同樣的機(jī)會(huì)下重復(fù)多次的結(jié)果計(jì)算出的等同“期望”的平均值。需要注意的是,期望值并不一定等同于常識(shí)中的“期望”——“期望值”也許與每一個(gè)結(jié)果都不相等。(換句話說(shuō),期望值是該變量輸出值的平均數(shù)。期望值并不一定包含于變量的輸出值集合里。)——WIKI 當(dāng)重復(fù)多次實(shí)驗(yàn)后,得出的實(shí)驗(yàn)結(jié)果和概率(樣本數(shù)據(jù)),能夠?qū)傮w數(shù)據(jù)的分布得出一個(gè)大致的輪廓。 通過(guò)以概率作為權(quán)數(shù)對(duì)樣本數(shù)據(jù)進(jìn)行加權(quán)平均得出的平均數(shù)作為期望值,結(jié)合標(biāo)準(zhǔn)差,我們可以認(rèn)為總體分布就在期望值附近,標(biāo)準(zhǔn)差相當(dāng)于誤差。 平均值是處理數(shù)據(jù)的一種方法。(平均值還有算術(shù)平均值、幾何平均值、加權(quán)平均值等分類(lèi)呢) 期望值是對(duì)總體估計(jì)進(jìn)行描述的一種形式。 所以,不存在「平均值被叫做期望值」這種說(shuō)法。 【繁繁星的回答(1票)】: 我這學(xué)期正好教公司金融的課程,其中就有涉及這個(gè)概念。 我的理解,平均值和期望值根本是兩個(gè)東西,樓主完全弄混了。為什么說(shuō)是兩個(gè)東西呢? 首先,平均值是對(duì)一系列數(shù)據(jù)歷史值的反應(yīng),而期望值是對(duì)未來(lái)數(shù)據(jù)的預(yù)測(cè)。其次,他倆算法也完全不同。 什么意思呢?舉個(gè)簡(jiǎn)單例子就可以看出來(lái)。 假如中石油股票,他的股價(jià)從2011年到2014年每年分別是20,30,50。那么,他的股價(jià)平均值就是33.3=(20+30+50)/3 你絕對(duì)不能說(shuō)這個(gè)數(shù)字是期望值。 那什么是期望值呢? 英文是Expected Value。從英文你就能看出來(lái),這是一個(gè)期待的,將要發(fā)生的價(jià)值。表示一個(gè)對(duì)未來(lái)的期待,但這事情未必會(huì)發(fā)生。 再舉這個(gè)中石油的例子,有人想知道它2015的股價(jià)。但沒(méi)人知道。所以有人做了個(gè)簡(jiǎn)單的模型。模型如下:假如2015年,有50%概率國(guó)家經(jīng)濟(jì)形勢(shì)好,那樣中石油股價(jià)會(huì)是80塊;30%概率經(jīng)濟(jì)形勢(shì)一般,那時(shí)中石油股價(jià)是50塊;20%概率經(jīng)濟(jì)形勢(shì)差,那時(shí)中石油股價(jià)會(huì)是10塊。 那么怎么算中石油股價(jià)的期望值呢?50%*80+30%*50+20%*10=57。這個(gè)57就是我們對(duì)中石油未來(lái)股價(jià)的一個(gè)期望。這個(gè)57塊根本沒(méi)發(fā)生,不是一個(gè)歷史數(shù)值,只不過(guò)是一個(gè)預(yù)測(cè)。 在金融上我的理解是這樣的,如果有錯(cuò)請(qǐng)指出。 【知乎用戶的回答(1票)】: 我覺(jué)得吧,期望是對(duì)于樣本來(lái)說(shuō)通過(guò)對(duì)其統(tǒng)計(jì)來(lái)對(duì)總體的一個(gè)未來(lái)預(yù)測(cè)值。 而平均數(shù)只是對(duì)過(guò)去的數(shù)據(jù)進(jìn)行計(jì)算。 一個(gè)是對(duì)未來(lái)的一個(gè)是對(duì)過(guò)去的,雖然很多時(shí)候兩個(gè)很像。但是并不是一個(gè)意思 【獨(dú)孤星夜的回答(0票)】: 其實(shí)是因?yàn)槟阍谧鲆幌盗歇?dú)立同分布的實(shí)驗(yàn),會(huì)得到一系列的觀測(cè)結(jié)果。而這些結(jié)果的平均值,就是期望的結(jié)果。 舉個(gè)例子,你用尺子量東西,量10次,得到了10個(gè)結(jié)果,那么它的平均值就是我們期望的所量物理的長(zhǎng)度。 【CarlaLu的回答(0票)】: 在時(shí)間序列中對(duì)平穩(wěn)序列的預(yù)測(cè)中,如果用簡(jiǎn)單平均法來(lái)分析,那么下一期的預(yù)測(cè)值等于前期觀測(cè)值的平均值。這里的預(yù)測(cè)值我覺(jué)得也可以理解為對(duì)未來(lái)的期望。 【胡桃?jiàn)A子的回答(0票)】: 不是期望就是平均數(shù),根據(jù)大數(shù)定律,他們依概率收斂罷了 【知乎用戶的回答(0票)】: mean of the mean is mean 【知不道的回答(0票)】: 題主提問(wèn)前應(yīng)該先確認(rèn)平均值是否應(yīng)該被叫做期望值 這倆不是一個(gè)東西 不能劃等號(hào) 【透過(guò)你de窗的回答(0票)】: 因?yàn)楣街皇瞧谕?/p> 【湯博懷的回答(0票)】: 占坑⊙﹏⊙ 【余舟的回答(0票)】: 平均值 = mean 期望 = expected 分明一個(gè)是名詞一個(gè)是形容詞,這倆哪一點(diǎn)一樣? 【waichawai的回答(0票)】: 數(shù)學(xué)期望起源于歷史上一個(gè)分賭本問(wèn)題,數(shù)學(xué)家帕斯卡首先提出這個(gè)概念 詳見(jiàn)概率論與數(shù)理統(tǒng)計(jì)茆詩(shī)松版 【米湯的回答(0票)】: 看了各位的回答以后我后悔提了這么一個(gè)問(wèn)題。作為一個(gè)文科生,作為一個(gè)從小到大的數(shù)學(xué)恐懼癥患者,你們的答案我完全看不懂?。。。。∑鋵?shí)我只是好奇為什么平均值會(huì)被叫做期望值這么反直覺(jué)的名稱(chēng)??偛荒苷f(shuō)我期望我能達(dá)到平均,所以平均值又被叫做期望值?當(dāng)然還是得感謝各位的真誠(chéng)回答,謝謝。 原文地址:知乎 |
|
|