电竞比分网-中国电竞赛事及体育赛事平台

分享

透徹理解高斯過(guò)程背后的哲學(xué)思想

 niudp 2018-12-31

我們?cè)跈C(jī)器學(xué)習(xí)過(guò)程中,經(jīng)常用到的參數(shù)化算法,把數(shù)據(jù)灌入假定好的'系統(tǒng)'中進(jìn)行模型訓(xùn)練,這里的假定就是指根據(jù)經(jīng)驗(yàn)確定好算法的參數(shù)。人們?cè)趯W(xué)習(xí)算法時(shí),對(duì)這樣的算法普遍比較容易接受和理解。而作為機(jī)器學(xué)習(xí)算法,高斯過(guò)程是一個(gè)無(wú)參數(shù)的方法。然而,大多數(shù)算法研究員(包括其他應(yīng)用目的的工程人員)發(fā)現(xiàn)很難從概念上、思維方式上理解這種方法。而實(shí)際上,高斯過(guò)程恰恰反映了現(xiàn)實(shí)世界的建模的自然過(guò)程,特別是在人工智能仿習(xí)人類(lèi)的思維方法論中,人類(lèi)在學(xué)習(xí)過(guò)程中是一個(gè)不斷的調(diào)試先驗(yàn)的過(guò)程。

本文試圖從哲學(xué)的角度來(lái)闡述和剖析高斯過(guò)程,從一定高度上深入、透徹的理解高斯過(guò)程。本文不對(duì)具體的公式進(jìn)行詳細(xì)推導(dǎo),后邊會(huì)專(zhuān)門(mén)講解高斯過(guò)程的數(shù)學(xué)思維及其推導(dǎo)。理解了這些重要思想,再進(jìn)一步的了解其數(shù)學(xué)過(guò)程,就非常容易了。

高斯過(guò)程簡(jiǎn)述

高斯過(guò)程(Gaussian Process)本質(zhì)上是一種機(jī)器學(xué)習(xí)算法,它利用數(shù)據(jù)點(diǎn)之間同質(zhì)性的度量作為核函數(shù),構(gòu)造協(xié)方差函數(shù),通過(guò)訓(xùn)練樣本得到聯(lián)合概率密度,進(jìn)而求得新數(shù)據(jù)預(yù)測(cè)值。

高斯過(guò)程背后的關(guān)鍵思想是可以使用無(wú)限維多變量高斯分布來(lái)對(duì)函數(shù)進(jìn)行建模。換句話說(shuō),輸入空間中的每個(gè)點(diǎn)都與一個(gè)隨機(jī)變量相關(guān)聯(lián),而它們的聯(lián)合分布可以被作為多元高斯分布建模。設(shè)高斯過(guò)程表示為GPmx,kx,x')),那么

  • 是關(guān)于函數(shù)的分布。
  • 完全由平均值函數(shù)m(x)和協(xié)方差函數(shù)k(x,x????)確定
  • 隨機(jī)函數(shù)的參數(shù)扮演著索引的角色。
  • 協(xié)方差函數(shù)定義函數(shù)空間中的屬性。
  • 數(shù)據(jù)點(diǎn)將函數(shù)'錨定'為特定位置。

一.先驗(yàn)的思想

在康德哲學(xué)中,'先驗(yàn)'同'經(jīng)驗(yàn)'相對(duì)。意為先于經(jīng)驗(yàn)的,但為構(gòu)成經(jīng)驗(yàn)所不可或缺的。

先驗(yàn)的設(shè)定取決于世界的形態(tài)、規(guī)律,我們講過(guò)高斯分布在現(xiàn)實(shí)世界上是普遍的存在,與我們中國(guó)傳統(tǒng)的'中庸哲學(xué)'也是非常的契合。在機(jī)器學(xué)習(xí)應(yīng)用中,醫(yī)學(xué)指標(biāo)、客戶(hù)畫(huà)像、信用評(píng)估、借款違約等都有大量的高斯分布存在。所以先驗(yàn)用高斯分布是由哲學(xué)依據(jù)的。

透徹理解高斯過(guò)程背后的哲學(xué)思想

上圖顯示了從GP先驗(yàn)中隨機(jī)抽取的三個(gè)函數(shù);點(diǎn)表示實(shí)際生成的y的值; 通過(guò)連接大量評(píng)估點(diǎn),其他兩個(gè)函數(shù)被繪制為線條。

透徹理解高斯過(guò)程背后的哲學(xué)思想

上圖顯示了從后驗(yàn)中抽取的三個(gè)隨機(jī)函數(shù),在先驗(yàn)條件,用五個(gè)無(wú)噪聲觀察點(diǎn)數(shù)據(jù)求得后驗(yàn)分布。

在兩個(gè)圖中,陰影區(qū)域代表了逐點(diǎn)平均值加上和減去每個(gè)輸入值的標(biāo)準(zhǔn)偏差的兩倍(對(duì)應(yīng)于95%置信區(qū)域),分別為先驗(yàn)和后驗(yàn)。

我們?cè)陂_(kāi)始時(shí)設(shè)置一個(gè)先驗(yàn),接下來(lái)我們就有了一個(gè)大致的依據(jù),通過(guò)對(duì)實(shí)際數(shù)據(jù)的觀察,改進(jìn)這個(gè)先驗(yàn),形成更反映數(shù)據(jù)數(shù)據(jù)規(guī)律的分布。

二.概率思想

從某種角度來(lái)說(shuō),現(xiàn)實(shí)世界是由概率來(lái)錨定的世界。

簡(jiǎn)單來(lái)說(shuō),更新貝葉斯推理中的先驗(yàn)意味著你從一些關(guān)于事件發(fā)生概率的猜測(cè)(先驗(yàn)概率)開(kāi)始,然后你觀察發(fā)生了什么(可能性),并根據(jù)發(fā)生的事情更新你的初始猜測(cè)。 更新后,先驗(yàn)概率稱(chēng)為后驗(yàn)概率

所以要預(yù)測(cè)新數(shù)據(jù)點(diǎn)的y值,從概率的視角看,我們可以用條件概率來(lái)預(yù)測(cè),即在歷史數(shù)據(jù)的X、Y值條件下,當(dāng)前y的概率分布。

所以,GP建模中的關(guān)鍵假設(shè)是我們的數(shù)據(jù)可以表示為來(lái)自多元高斯分布的樣本,我們有

透徹理解高斯過(guò)程背后的哲學(xué)思想

我們當(dāng)然對(duì)條件概率p(y* | y)更感興趣:'給定數(shù)據(jù),y *的特定預(yù)測(cè)的概率有多大?'。 這個(gè)條件概率仍然遵循高斯分布(推導(dǎo)過(guò)程略),所以有:

透徹理解高斯過(guò)程背后的哲學(xué)思想

我們對(duì)y*的最佳估計(jì)是這種分布的平均值:

透徹理解高斯過(guò)程背后的哲學(xué)思想

我們估計(jì)的不確定性由方差給出:

透徹理解高斯過(guò)程背后的哲學(xué)思想

下面舉一下高斯過(guò)程用于回歸的例子:

以下是25個(gè)數(shù)據(jù)點(diǎn)的點(diǎn)圖,每一個(gè)點(diǎn)服務(wù)一個(gè)高斯分布,我們要計(jì)算點(diǎn)2在點(diǎn)1發(fā)生時(shí)的條件概率,已知f1=-0.313。

透徹理解高斯過(guò)程背后的哲學(xué)思想

以下這兩個(gè)點(diǎn)的協(xié)方差矩陣

透徹理解高斯過(guò)程背后的哲學(xué)思想

我們用高斯分布來(lái)求解f2的條件概率:

透徹理解高斯過(guò)程背后的哲學(xué)思想

綠色代表f1是先驗(yàn),藍(lán)色是聯(lián)合概率密度函數(shù),紅色是條件概率密度函數(shù)。

最后我們得到在f1發(fā)生時(shí)f2的條件概率:

P(f2|f1)=-0.313

三.相關(guān)性哲學(xué)

在機(jī)器學(xué)習(xí)中,不管是分類(lèi),還是回歸,我們都要根據(jù)已有數(shù)據(jù)訓(xùn)練出模型,然后代入新數(shù)據(jù),得到新數(shù)據(jù)的預(yù)測(cè)值。然而,高斯過(guò)程,我們也沒(méi)有參數(shù)化的模型,我們?cè)趺床拍艿玫筋A(yù)測(cè)值呢?

這里就要用到相關(guān)性哲學(xué),在哲學(xué)中,聯(lián)系是普遍存在的,相關(guān)性(以下相似性,便于數(shù)學(xué)理解)也是普遍存在的,我們刻畫(huà)一個(gè)新事物,往往會(huì)先找到它與熟悉事物之間的關(guān)聯(lián)性。

所以由于內(nèi)含于高斯聯(lián)合分布中變量之間的相似性,我們可以在高斯分布中融入數(shù)據(jù)點(diǎn)之間相似性,求他們目標(biāo)變量之間的概率關(guān)系,進(jìn)而獲得新數(shù)據(jù)的目標(biāo)值的分布。當(dāng)相似度高時(shí),他們的目標(biāo)值相近程度高;反之,相近程度低。

我們用數(shù)學(xué)來(lái)描述一下:

高斯分布是用協(xié)方差矩陣來(lái)定義變量之間的相似度。既然協(xié)方差矩陣的元素是相似性度量,那么我們完全可以用一種相似性度量來(lái)替換原來(lái)的協(xié)方差。

透徹理解高斯過(guò)程背后的哲學(xué)思想

σf2用來(lái)確保協(xié)方差的最大值。

如果x≈x,那么k(x,x')達(dá)到最大值,意味著f(x)幾乎與f(x')相等。

如果我們希望我們的函數(shù)看起來(lái)平滑,那么鄰居必須是相似的。 現(xiàn)在,如果x遠(yuǎn)離x',則我們?nèi)《氖莐(x,x')≈0 ,即兩個(gè)點(diǎn)不能相互作用。因此,例如,在新x值的插值過(guò)程中,遠(yuǎn)距離觀察值將效果可以忽略不計(jì)。 這種分離的影響程度取決于長(zhǎng)度參數(shù)l。

最后,用圖形說(shuō)明:

  • 假設(shè)我們的數(shù)據(jù)符合下面的函數(shù)圖形,現(xiàn)在我們通過(guò)高斯過(guò)程來(lái)求得這個(gè)函數(shù)(實(shí)質(zhì)上是求得符合這個(gè)函數(shù)的高斯分布)。

透徹理解高斯過(guò)程背后的哲學(xué)思想

  • 下圖是只用兩個(gè)觀察點(diǎn)來(lái)預(yù)測(cè)函數(shù),可見(jiàn)其方差比較大:

透徹理解高斯過(guò)程背后的哲學(xué)思想

  • 增加到10個(gè)點(diǎn),可見(jiàn)曲線與實(shí)際曲線越來(lái)越接近,并且越來(lái)越平滑。

透徹理解高斯過(guò)程背后的哲學(xué)思想

當(dāng)涉及豐富的建??赡苄院痛罅侩S機(jī)參數(shù)時(shí),高斯過(guò)程十分簡(jiǎn)單易用。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶(hù)發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶(hù) 評(píng)論公約

    類(lèi)似文章 更多