白話統(tǒng)計(jì)(2):中心極限定理http://johnthu.spaces./blog/cns!2053CD511E6D5B1E!377.entry 資料來自美國G.H.維恩堡等著的《數(shù)理統(tǒng)計(jì)初級教程》(常學(xué)將等譯,太原:山西人民出版社,1986) 《白話統(tǒng)計(jì)(1):平均數(shù)、中位數(shù)、眾數(shù)》 *************************************************************************
在傳統(tǒng)概率論教科書上,一般會這么陳述這個定理:
想像一個很大的箱子,裝滿了小紙條,可供我們無窮無盡地抽取,每張紙條上寫有一個數(shù)字。為簡單起見,假定只有0、1、2三個數(shù)字,且每個數(shù)字出現(xiàn)在每張紙條上的可能性都是1/3。記住,這個箱子里的紙條如此之多,以致我們可以抽取任一數(shù)目的任一種紙條,而不必?fù)?dān)心會改變箱中剩下的各種紙條之間的比例。 箱子有一個小口,通過它,每次可以釋放出一張紙條。箱子還有一個洗牌裝置,這種裝置會把紙條洗得這樣得均勻,以至當(dāng)我們決定抽取一張時,每張紙條有同樣的被釋放出來的機(jī)會。因此,我們的觀察室獨(dú)立的,而且我們的樣本是隨機(jī)的。 現(xiàn)在我們就來抽取等容量的隨機(jī)樣本,假設(shè)每個樣本都包含200張紙條。 我們一張一張地抽取200張紙條。比如頭一張紙條上的數(shù)字是2,第二張紙條的數(shù)字是0,第三張紙條是2,如此等等。假設(shè)構(gòu)成這個第一份樣本的200張紙條上的數(shù)字總和是210,這個和成為所產(chǎn)生的新的分布的第一項(xiàng)。 第二個樣本的200張紙條上的數(shù)字之和比如是194.對大量的樣本,每個樣本都包含200張紙條,重復(fù)這個過程。定理1告訴我們,這種樣本和數(shù)越來越多時,樣本和的分布近似于正態(tài)分布。
關(guān)于定理1,對被抽取樣本的那個總體沒有要求任何限制。不管被抽取樣本的那個總體,其分布的形狀如何,樣本和的分布都是正態(tài)的。 定理1說明,為什么正態(tài)分布出現(xiàn)在如此多的不同的問題之中。我們用于紙條取樣的那種方法,看來是實(shí)際中特別喜歡使用的一種方法。在每次情況中出現(xiàn)的、構(gòu)成一個正態(tài)分布的那些數(shù),都可以看作獨(dú)立觀察資料的等容量樣本的和。 例子1??疾焐鋼魰r圍繞靶子構(gòu)成正態(tài)分布的子彈。每一顆子彈擊中的位置實(shí)際上是許多隨機(jī)影響的和,比如姿勢、風(fēng)向、光線、心理等等。這些因素和諸如此類因素的影響,同時在一位特定射手的身上起作用;且對于不同的射手,它們是不同的。一個射手的得分,表明他的子彈最終射到何處去了,這個得分是那些隨機(jī)影響的樣本之和。具體地,比如每一個射手的分布式70項(xiàng)主要影響之和,因而每一發(fā)子彈的得分,都可以看作是70項(xiàng)的一個樣本和(與70張紙條上的那些數(shù)字的和相對應(yīng))。這樣一來,不同射手的得分,就可以看作是不同的等容量樣本的和。根據(jù)定理1,子彈得分的分布式正態(tài)的。 例子2??疾烀總€人的智力水平,也可以當(dāng)作出自不同根源的小影響的和來看待,包括營養(yǎng)、機(jī)會、性格、遺傳等等等等。這么看來,大量的人的智力水平的分布式正態(tài)的。
樣本平均數(shù)的集合可以通過樣本和集合直接得到,因此平均數(shù)的分布就是和的分布的一個小比例的變形。樣本平均數(shù)的分布用兩個有用的性質(zhì):
定理2及其兩個性質(zhì)就是我們熟悉的mean(X)~N(μ,σ**2/n)。 |
|
|