电竞比分网-中国电竞赛事及体育赛事平台

分享

高斯!為什么又是你?

 bulaolindtsg 2019-03-12

 

這個(gè)男的叫高斯,約翰·卡爾·弗里德里?!じ咚梗蠈W(xué)之后n次見過這個(gè)名字。他最有名的分布是高斯函數(shù),或者也稱為高斯分布,或正態(tài)分布,其形式為:

高斯函數(shù)應(yīng)用范圍很廣,在自然科學(xué)、社會(huì)科學(xué)、數(shù)學(xué)以及工程學(xué)等領(lǐng)域都能看到它的身影。尤其是機(jī)器學(xué)習(xí)中,比如簡單判斷一組數(shù)據(jù)的分布、混合高斯模型、各種模型的誤差量e、RBF神經(jīng)網(wǎng)絡(luò)等等(自己也是小白,只能想到這么多,求各位補(bǔ)充),然后無數(shù)次知道各種條件求 μ和∑。但是有沒有想過為什么是高斯函數(shù)不是其他分布?為什么高斯函數(shù)這么寫?為什么高斯函數(shù)用處怎么廣?它是何方神圣?高斯,為什么又是你?

遇事不決著骰子,擲一顆質(zhì)體均勻的骰子出現(xiàn)的點(diǎn)數(shù) X 的概率分布:

擲兩顆質(zhì)體均勻的骰子出現(xiàn)的點(diǎn)數(shù)之和 X=X1+X2的概率分布:

擲三顆質(zhì)體均勻的骰子出現(xiàn)的點(diǎn)數(shù)之和X=X1+X2+X3的概率分布:

擲四顆質(zhì)體均勻的骰子出現(xiàn)的點(diǎn)數(shù)之和X=X1+X2+X3+X4的概率分布:

從以上例子可以看出,隨著n的增大,擲n顆質(zhì)體均勻的骰子出現(xiàn)的點(diǎn)數(shù)之和X=X1+X2+...+Xn的極限分布為正態(tài)分布。

如果你說之前的是1~6擲塞子概率分布均勻,是不是有貓膩。再看一個(gè)分布:

如有四個(gè)分布X=X1+X2+X3+X4以后分布為。

隨著n的增大 , 個(gè)相互獨(dú)立的服從區(qū)間上的均勻分布的隨機(jī)變量之和

X=X1+X2+...+Xn的極限分布為正態(tài)分布。

由此可得一般的結(jié)論:一系列相互獨(dú)立的隨機(jī)變量(不管這個(gè)隨機(jī)變量是啥)的和的分布趨向于正態(tài)分布,這就是大名鼎鼎中心極限定理的核心內(nèi)容。

所以,一系列相互獨(dú)立的隨機(jī)變量的和的分布趨向于正態(tài)分布, 這就是中心極限定理的核心內(nèi)容,中心極限定理為大樣本統(tǒng)計(jì)提供了可靠的理論保證。在統(tǒng)計(jì)推斷的過程中,不論總體服從什么分布,只要樣本容量 較大( n>10打個(gè)比方) ,就可以按照樣本均值服從正態(tài)分布構(gòu)造統(tǒng)計(jì)量對總體進(jìn)行統(tǒng)計(jì)推斷。

這就是為什么許多分布的參數(shù)估計(jì)我們把數(shù)據(jù)估計(jì)成正態(tài)分布,因?yàn)橐粋€(gè)數(shù)據(jù)發(fā)布可能是由很多隨機(jī)變量之和所構(gòu)成,比如

1、大量用戶的用電量(用電量對時(shí)間)由無數(shù)個(gè)用戶構(gòu)成,我們不知道每個(gè)用戶用電量的數(shù)據(jù)分布,但是它們用電量之和一定是正態(tài)分布。

2、一個(gè)模型的誤差可能有很多細(xì)小的誤差相加構(gòu)成,但是我們知道這些小誤差相加一定是正態(tài)分布。

所以如果世界有g(shù)od,這個(gè)god就是高斯,為什么它知道無數(shù)個(gè)雜亂無章的世界里的有序態(tài),真是有趣。

    本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多