电竞比分网-中国电竞赛事及体育赛事平台

分享

白話統(tǒng)計(jì)(2):中心極限定理 — Windows Live

 石頭狗 2009-01-06

白話統(tǒng)計(jì)(2):中心極限定理

http://johnthu.spaces./blog/cns!2053CD511E6D5B1E!377.entry

資料來自美國G.H.維恩堡等著的《數(shù)理統(tǒng)計(jì)初級教程》(常學(xué)將等譯,太原:山西人民出版社,1986)

《白話統(tǒng)計(jì)(1):平均數(shù)、中位數(shù)、眾數(shù)》

*************************************************************************

定理1:(中心極限定理)假定大量的等容量隨機(jī)樣本都是從同一無限總體采樣的,算出每個樣本的和,并把不同樣本的和放在一起以形成一個新的分布,于是這個新的分布就是漸近正態(tài)的(其中要假定產(chǎn)生這些和的隨機(jī)樣本每個容量是足夠大)。

在傳統(tǒng)概率論教科書上,一般會這么陳述這個定理:

定理1`:(獨(dú)立同分布的中心極限定理)設(shè)隨機(jī)變量X1,…Xn,…相互獨(dú)立,服從同一分布,且具有相同的數(shù)學(xué)期望和方差,則隨機(jī)變量之和ΣXi的標(biāo)準(zhǔn)化變量服從標(biāo)準(zhǔn)正態(tài)分布。

演示性例子

想像一個很大的箱子,裝滿了小紙條,可供我們無窮無盡地抽取,每張紙條上寫有一個數(shù)字。為簡單起見,假定只有0、1、2三個數(shù)字,且每個數(shù)字出現(xiàn)在每張紙條上的可能性都是1/3。記住,這個箱子里的紙條如此之多,以致我們可以抽取任一數(shù)目的任一種紙條,而不必?fù)?dān)心會改變箱中剩下的各種紙條之間的比例。

箱子有一個小口,通過它,每次可以釋放出一張紙條。箱子還有一個洗牌裝置,這種裝置會把紙條洗得這樣得均勻,以至當(dāng)我們決定抽取一張時,每張紙條有同樣的被釋放出來的機(jī)會。因此,我們的觀察室獨(dú)立的,而且我們的樣本是隨機(jī)的。

現(xiàn)在我們就來抽取等容量的隨機(jī)樣本,假設(shè)每個樣本都包含200張紙條。

我們一張一張地抽取200張紙條。比如頭一張紙條上的數(shù)字是2,第二張紙條的數(shù)字是0,第三張紙條是2,如此等等。假設(shè)構(gòu)成這個第一份樣本的200張紙條上的數(shù)字總和是210,這個和成為所產(chǎn)生的新的分布的第一項(xiàng)。

第二個樣本的200張紙條上的數(shù)字之和比如是194.對大量的樣本,每個樣本都包含200張紙條,重復(fù)這個過程。定理1告訴我們,這種樣本和數(shù)越來越多時,樣本和的分布近似于正態(tài)分布。

如何實(shí)際運(yùn)用定理1

關(guān)于定理1,對被抽取樣本的那個總體沒有要求任何限制。不管被抽取樣本的那個總體,其分布的形狀如何,樣本和的分布都是正態(tài)的。

定理1說明,為什么正態(tài)分布出現(xiàn)在如此多的不同的問題之中。我們用于紙條取樣的那種方法,看來是實(shí)際中特別喜歡使用的一種方法。在每次情況中出現(xiàn)的、構(gòu)成一個正態(tài)分布的那些數(shù),都可以看作獨(dú)立觀察資料的等容量樣本的和。

例子1??疾焐鋼魰r圍繞靶子構(gòu)成正態(tài)分布的子彈。每一顆子彈擊中的位置實(shí)際上是許多隨機(jī)影響的和,比如姿勢、風(fēng)向、光線、心理等等。這些因素和諸如此類因素的影響,同時在一位特定射手的身上起作用;且對于不同的射手,它們是不同的。一個射手的得分,表明他的子彈最終射到何處去了,這個得分是那些隨機(jī)影響的樣本之和。具體地,比如每一個射手的分布式70項(xiàng)主要影響之和,因而每一發(fā)子彈的得分,都可以看作是70項(xiàng)的一個樣本和(與70張紙條上的那些數(shù)字的和相對應(yīng))。這樣一來,不同射手的得分,就可以看作是不同的等容量樣本的和。根據(jù)定理1,子彈得分的分布式正態(tài)的。

例子2??疾烀總€人的智力水平,也可以當(dāng)作出自不同根源的小影響的和來看待,包括營養(yǎng)、機(jī)會、性格、遺傳等等等等。這么看來,大量的人的智力水平的分布式正態(tài)的。

定理2:(定義1的一個變形,平均數(shù)的中心極限定理)假定,大量的等容量隨機(jī)樣本是從同一無限總體中采集的,算出每一個樣本的平均數(shù),并把不同樣本的平均數(shù)放到一起形成一個新的分布,于是這個新的分布就是漸近分布的(假定產(chǎn)生這些平均數(shù)的隨機(jī)樣本容量是足夠大的)。

樣本平均數(shù)的集合可以通過樣本和集合直接得到,因此平均數(shù)的分布就是和的分布的一個小比例的變形。樣本平均數(shù)的分布用兩個有用的性質(zhì):

  1. 假定無窮多個等容量隨機(jī)樣本是從同一無限總體中抽取的,而且把這些樣本的平均數(shù)放到一起,以構(gòu)成一個新的分布,那么這個新分布(樣本平均數(shù)構(gòu)成的)的均值與原總體的均值相同。
  2. 假定無窮多個等容量隨機(jī)樣本是從同一無限總體中抽取的,以n表示每一個樣本的容量,這些樣本的平均數(shù)的分布有一個標(biāo)準(zhǔn)差,它等于原總體的標(biāo)準(zhǔn)差除以n的平方根。

定理2及其兩個性質(zhì)就是我們熟悉的mean(X)~N(μ,σ**2/n)。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多