|
根據(jù)貝葉斯腦理論,為了在錯綜復雜的世界生存,大腦積極地收集外部信息,進行概率計算和推理預測。我們所看到的的“現(xiàn)實”,其實是基于大腦對世界形成的假設形成的,是大腦構(gòu)筑的“幻覺”。 作者 | Manuel Brenner 翻譯 | Yael 審校 | 酷炫腦主創(chuàng) & 小草 編輯 | 黃喜歡 美工 | 豆?jié){ 來源:炫酷腦 hackernoon 要是你們能夠洞察時間所播的種子,知道哪一顆會長成,哪一顆不會長成...... ——《麥克白》,威廉·莎士比亞生活充斥著不確定性,沒有人可以預知未來。正如布萊士·帕斯卡(Blaise Pasca)所說, 我們航行在遼闊無邊的區(qū)域里,永遠沒有把握地漂流著,從一頭被推到另一頭。(we sail within a vast sphere, ever drifting inuncertainty, driven from end to end) 沒有人知曉死亡何時會降臨,生活何時會帶給我們苦難,又在何時給予回報。 盡管不得不在人生的某個時刻里沉悶地接受這個教訓,但我們依舊在這個由不確定性組成的世界里取得了了不起的成績。我們買房,在銀行賬戶攢錢,為了退休金和子女存錢。我們建立穩(wěn)定的人際關(guān)系,紀念每一段感情。我們掌控著,也理應掌控著正在發(fā)生的事。 對于像我們這樣從隨機混亂且異想天開的進化中生存下來的生物來說,能做到這樣已經(jīng)很了不得了。那么在不確定的未來面前,我們是如何感知到“確定無疑”的呢? 貝葉斯腦假說(The Bayesianbrain hypothesis)主張我們的行為背后隱藏著一種機制,其根源可以追溯到生命的本質(zhì)。該假說認為,在某種意義上,除了預測未來和實現(xiàn)這個預測到的未來之外,大腦幾乎沒有做任何其他的事,此外,它還和生物系統(tǒng)一起,與大自然為它們準備的意外“驚喜”長期不懈地艱苦戰(zhàn)斗著。 thenegativepsychologist 01 穩(wěn)態(tài)的必要性 穩(wěn)態(tài)(Homeostasis)是所有生命體遵循的一條基本法則。它衍生于拉丁語homeo(equal,平等的)和 stasis(to stand still,靜止不動),由沃爾特·布拉福德·坎農(nóng)于 1926 年創(chuàng)造出來。穩(wěn)態(tài)是生物系統(tǒng)內(nèi)部生理和化學過程的動態(tài)平衡,這有利于維持生物系統(tǒng)的完整和效率。這是一種自我調(diào)整的原則,用來應對自然界的無秩序特征。 安東尼奧·達馬西奧(Antonio Damasio)在他的《事物的奇怪秩序》(The Strange Order of Things)一書中指出這一概念有所偏頗,穩(wěn)態(tài)的內(nèi)涵遠遠高于“靜止不動”(standstill)。生命的特性是自我實現(xiàn)的(self-realizing),而不是僅僅滿足于維持眼下所擁有的功能。 如果有兩種存在競爭的有機體擺在你面前,一個滿足于它目前所擁有的一切,另一個則為了未來而不斷優(yōu)化,你認為哪一個更有機會生存幾百萬甚至幾十億年?如今,我們發(fā)現(xiàn)生命其實一直在“默默地推動自己到達更遙遠的未來”,因為它在過去進化出了更有利于在未來繼續(xù)生存的特性。 像車輪一樣滾動,保持呼吸,向前走。 artistsandillustrators 人們一直試著預測和改變未來。在古代,算命占卜是專屬于司祭和巫師的精妙手藝。德爾斐神諭(the Oracle of Delphi)大概是最出名的一個例子了。希臘政治家和羅馬皇帝千百年來都會向它求教。古時的政治充滿了各種不確定性,我們不應對人們想要減少這種不確定性的訴求太過苛刻。 但是從現(xiàn)代科學的角度來看,我們已經(jīng)知道,在恍惚的狀態(tài)下吸入毒性氣體和打謎語不可能會讓我們真正了解到世界的運作機制。為了減少對未來的不確定性,我們(和我們的大腦)需要采取更接地氣的方法,以掌握的知識為基礎(chǔ)預測未來。根據(jù)我今天對世界的觀察,我能預計明天會發(fā)生些什么呢?為了獲得最有利于生存的結(jié)果,我又該如何行動? *譯者注:據(jù)記載,傳達德爾斐神諭的先是一位名叫皮提亞的女性,她在預言時周身被巖層裂隙中冒出的神秘氣體環(huán)繞,進入一種瘋癲的、疑似被上身的狀態(tài)。目前有學者經(jīng)過研究提出這種氣體可能是乙烯類物質(zhì),對人產(chǎn)生了麻痹作用。 02 貝葉斯定理 在 18 世紀,備受尊崇的托馬斯·貝葉斯(Thomas Bayes)提出了一個小定理,雖然貝葉斯沒有在在世時把它發(fā)表出來,它卻在后來的許多領(lǐng)域中發(fā)揮了巨大作用。這個定理很簡單,但并不妨礙它使貝葉斯成為現(xiàn)代認知科學中最出名的人物。 在下圖中我們可以看到它的藍色發(fā)光版本: Bayes’ theorem | mattbuck (category) [CC BY-SA 2.0] 貝葉斯定理描述的是在 B 為前提條件的情況下, A 發(fā)生的概率等于以 A 為前提B的發(fā)生概率,乘以 A 發(fā)生的概率,再除以 B 的發(fā)生概率。 它給出了在我們已知其他相關(guān)條件發(fā)生的概率時,某特定事件的發(fā)生的可能性。 希望你已經(jīng)猜到為什么這個公式會在預測未來時能派上用場。 作為“變幻無?!钡拇~,天氣是冷酷無情的大自然用來打擊我們的最直接的方式,也是應用貝葉斯定理的絕佳案例。 我們假設一下這樣的情景:你外出散步,但出于某些原因迷失在干旱無邊的沙漠中。原本只是計劃在公園里走走,所以你身上只帶了一小瓶水。過了三天后,你已經(jīng)干渴難耐。在這天早上你抬頭仰望天空,驚訝地發(fā)現(xiàn)在地平線上,有一小朵云。那么,有多大的可能性會下雨,讓你免于渴死呢? 這里要計算的概率就是P(Rain | Cloud),也就是當你看見云朵時,沙漠會下雨的概率。我們需要的其他條件有: 1.P(Cloud | Rain):雨天的早上是不是都會出現(xiàn)云呢?我們假設沙漠中80%的雨天早上都會出現(xiàn)云朵,這就意味著在早上看見云的話,這一天有很大幾率會下雨2.P(Cloud):沙漠中會出現(xiàn)云的概率非常小, 10% 左右。3.P(Rain):下雨的概率就更低了。沙漠中每百天才會下一次雨,所以概率是1%。 所以你在沙漠中看見云朵后,這一天會下雨的概率為: P(Rain | Cloud) = P(Cloud | Rain)*P(Rain) / P(Cloud) = 0.8 * 0.01 / 0.10 = 0.08可以說,看見云朵后差不多有百分之八的概率這一天會下雨。希望很小,但聊勝于無。 reinertfineart 重要的是,在計算你需要的概率時,另外三個概率是必不可少的。丟棄任何一個都會明顯改變你的結(jié)果。 03 假陽性 貝葉斯定理可以幫助我們糾正假陽性(False Positive),比如說我們推測某個事件對結(jié)果是有意義的,但實際上它并不是。一個著名的例子就是癌癥測試(或者任何其它罕見疾?。?。 *譯者注:假陽性又稱為誤報、虛假肯定、偽正性。 假設只有 0.1% 的人口患有某種特定的癌癥。你的醫(yī)生告訴你有一種新型改良的癌癥測試,在患癌的情況下,它檢測的正確率為 90% 。缺點就是,當病人并沒有患癌時,它也會有大概 9% 的概率將病人檢測為癌癥。 你是一個天生就對這個問題有些焦慮的人,你想通過做這個測試來緩解焦慮。最終你得到的結(jié)果是陽性。你害怕極了,畢竟你得癌癥的概率是 90% 不是嗎? 不,不是的。你可以快速地運用貝葉斯定理來推算你患癌的真正幾率。請注意,在這種情況下,你需要區(qū)分真實肯定和虛假肯定的概率: P(cancer | positiveresult)= P(positiveresult | cancer)* p(cancer)/(p(positiveresult)* p(cancer)+ p(falsepositive)* p(nothaving cancer))= 9.17% 所以你并不需要太擔憂(出于焦慮所以進行測試,想必肯定很難做到不擔憂),因為患癌的概率是很低的,檢測結(jié)果假陽性的幾率是檢測陽性且真患癌的概率的 10 倍。 04 用先驗概率預測未來 對預測未來有興趣的人來說,掌握事件發(fā)生的先驗概率(prior probability)是很有幫助的。 在觀察天空或者進行癌癥測試時,為了判斷一個事件(比如發(fā)現(xiàn)天上有云朵,或者癌癥測試結(jié)果呈陽性)是否能幫助我們對另一個事件(比如下雨,或者真的患了癌癥)進行預測,我們需要對下雨和患癌的整體概率進行描述。 我們的感官從外部世界收集到的信息會被大腦進行分類,在分類的同時,大腦會不停地計算概率。你可能在想為什么它運作的方式跟貝葉斯定理有關(guān)。 假設你看到一個四條腿的動物在地平線上飛奔的模糊輪廓,它的前額上有一個長而尖的東西。 你的大腦有沒有自動得出這個動物是個獨角獸(unicorn)的結(jié)論? 這很可能不是個真的獨角獸 | PAndrea Tummons on Unsplash 如果你精神還正常,你可能不會得出這個結(jié)論,因為在出現(xiàn)獨角獸形狀物體的情況下,真的看見一個獨角獸的概率 P (unicorn | shape),是由獨角獸真正存在的先驗概率 P(unicorn)決定的,然而這個概率差不多是 0 。 05 用貝葉斯推斷建模世界 如果大腦想要對世界上的事件進行建模,尤其是未來的事件,那么它需要有一個關(guān)于世界是如何運作的模型,以便理解世界會如何發(fā)展、變化。 在接收到有關(guān)世界現(xiàn)狀的新信息,比如新的樣本后,大腦需要更新這個內(nèi)部模型。假設你時常在每天上下班的路上看見一個獨角獸,大概多久之后你會開始懷疑“世界上不存在獨角獸”這個說法是否成立?或者假設有 50 個人癌癥測試結(jié)果為陽性,其中有 20 個真的得了癌癥,對于只有 9.17% 的人才會真的患癌這個估計,你還有多大的信心認為它是對的? the beekman school 在新信息的基礎(chǔ)上,以最優(yōu)化統(tǒng)計的方式更新內(nèi)部模型的概率分布被稱為貝葉斯推斷(Bayesian Inference)。 我們在行為實驗中時常發(fā)現(xiàn)大腦會進行這種推斷,或者在將感覺輸入信息互相關(guān)聯(lián)時:有研究表明,在巴甫洛夫有關(guān)的刺激實驗中,不同刺激物之間的共有信息會優(yōu)先被處理。 另一個例子來自于布里頓(Britten)等人于 1992 年做的視覺運動實驗,他們觀察到猴子在對視覺運動的一致性進行解碼時,它們的大腦對刺激物的神經(jīng)反應速率十分接近于貝葉斯最優(yōu)解碼速率。事實證明,大腦會以我們已知的方式預測未來。 06 貝葉斯腦假說 現(xiàn)在我們可以深入討論貝葉斯腦假說(The Bayesian Brain Hypothesis)的內(nèi)涵到底是什么了。貝葉斯腦存在于外部世界,并被賦予了這個外部世界的內(nèi)在表征。這兩者被所謂的馬爾科夫毯區(qū)分開來。 *譯者注:Markov blanket,也稱馬爾科夫覆蓋。馬爾科夫毯是貝葉斯網(wǎng)絡中的一個核心概念,可以理解為某個目標變量的最小特征集,所有與目標變量有關(guān)的信息都包含在它的馬爾科夫毯中。馬爾科夫毯中的信息集與之外的集合相互獨立。 大腦會試著根據(jù)它自身生成的有關(guān)世界的模型,來推斷知覺的成因。為了成功地對外部世界進行建模,在某種程度上,它必須能夠模擬外部世界正在發(fā)生的事。用卡爾·弗里斯頓(Karl Friston)的話來說: 如果大腦要推斷感知覺產(chǎn)生的原因,那么它必須有一個模型來描述引起感覺輸入的(潛在的)客觀情形之間的因果關(guān)系(聯(lián)系)。進而神經(jīng)組織會對參與產(chǎn)生感官信息的因果關(guān)系進行編碼(建模)。 卡爾·弗里斯頓(Karl Friston)| wired 這是理解貝葉斯腦假說的第一個關(guān)鍵點,也是一個深刻的觀點:大腦內(nèi)部的世界模型證明,大腦的處理加工,是模擬外部世界運作的結(jié)果。為了成功地預測未來,大腦需要用自己的結(jié)構(gòu)去模擬外在世界。這些過程需要遵循跟外部世界類似的因果關(guān)系,而且大腦自身還會對此進行觀察監(jiān)督。第二個關(guān)鍵點回到貝葉斯推理上:從某種意義上說,大腦是遵循最優(yōu)化原則的,正如我們發(fā)現(xiàn)大自然也是朝著最優(yōu)化方向發(fā)展那樣。 就像我之前提到過的,在對知覺內(nèi)容進行分類,并在不確定的情境下做決策時,貝葉斯腦的工作狀態(tài)近似于貝葉斯最優(yōu)水平。這意味著在對未來(潛在的)狀況進行預估時,它盡可能考慮到了所有可用信息和所有概率約束。 你可以給被優(yōu)化的量取幾個名字,但實際上對各種理論進行深挖、整合后發(fā)現(xiàn),不同觀點所指的被優(yōu)化的量看似不同,其實內(nèi)核都是一樣的。有一種考察方式就是把它看作證據(jù)(evidence),在信息論中,證據(jù)等同于感官和內(nèi)部世界模型共有信息的最大化。 07 自由能量最小化 我在寫自由意志的熱力學(TheThermodynamics of Free Will)這篇文章時,詳細地討論了卡爾·弗里斯頓有關(guān)主動推理(Active Inference)的理論。 自由能量(Free Energy)最小化是為了優(yōu)化模型的信息或邊際似然性,弗里斯頓將自由能量的定義跟模型意外度(surprise of the model)的最小化聯(lián)系在了一起(也就是盡量減少與你的內(nèi)在世界模型不相符的體驗)。 該理論進一步將它的元素與生物系統(tǒng)相結(jié)合,比如說大腦,因為它可以對外界施加作用。你不該只是在腦中臆想未來,你能對外界施加影響,追求并實現(xiàn)自己的愿望,主動地改變未來。 據(jù)弗里斯頓說,主動推理(ActiveInference,AI)跟人工智能(Artificial Intelligence,AI)“撞縮寫”并不是個巧合,他相信“在 5 到 10 年內(nèi),大多數(shù)的機器學習都將涵蓋自由能量最小化(Free energy minimization)原理”。 這又令我們想起了達馬西奧對穩(wěn)態(tài)的批判: 生命系統(tǒng)并不是靜止不動的,為了使意外最小化并在充斥著不確定性的未來中生存,它始終在對外界產(chǎn)生著影響。 就像永不停息的瀑布一般 | gtglobalcinema 最小化的自由能與熵(entropy)有關(guān),因為意外度的時間平均值(time-average over the surprise)給出了熵的度量。這會造成物理性質(zhì)的結(jié)果,弗里斯頓這樣說道: 貝葉斯腦在將它所掌握的證據(jù)最大化時,實際上也正在隱晦地將它的熵最小化。換句話說,它在對抗著熱力學第二定律,并在面對走向無序的自然界時,為生命系統(tǒng)的自組織(self-organization)提供了一個原則性的解釋。 *譯者注:熵是用來衡量系統(tǒng)混亂程度的量。根據(jù)熱力學第二定律,宇宙的熵會不斷增大到最大值,最后所有的一切都會變成無序、解體、無意義的狀態(tài)。但根據(jù)生物進化論,生命體從簡單形態(tài)自發(fā)進化到復雜形態(tài),始終保持有序、有組織的狀態(tài),與熱力學第二定律看似存在矛盾。有觀點認為生物通過與外界進行能量交互來增序減熵,避免走向混亂無序。 因此貝葉斯腦假說是一個有關(guān)基本問題的理論。它將大腦活動與穩(wěn)態(tài)概念結(jié)合在了一起,解釋生命系統(tǒng)是如何在注定消亡的世界里掙扎求存。 08 我們該如何考察貝葉斯腦? 其一是提出體系龐大的理論,其二是在大腦活動中尋找證據(jù)。如果大腦的確是按照貝葉斯腦假說的原理活動,那么我們需要進一步了解大腦是如何實現(xiàn)貝葉斯推理的。 學者認為貝葉斯推理發(fā)生在從運動控制到注意和工作記憶等多種認知層面上。每個認知模塊都有各自的預期、內(nèi)部模型和時間尺度。 有一個叫做預測編碼(Predictive Coding)的理論被認為很有希望揭開這個秘密,它的核心觀念跟貝葉斯腦是一致的:通過改變預測模型的參數(shù),在相同事件發(fā)生時將(實際與預測的)差異最小化。有不少實驗證據(jù)支持了該理論,例如在詞匯預測實驗中發(fā)現(xiàn)了 N400 效應。 認知科學界逐漸認識到,大腦并不僅僅是一個被動接收外界信息并作出反應的探測器。它不斷地通過假設世界的真實模樣和預測未來,以自上而下的方式生成內(nèi)部世界模型(這意味著低階的信息感知是在高階思維的指導下進行的,就像獨角獸那個例子一樣)。 這使得研究者們將現(xiàn)實描述成“受控的幻覺”(controlled hallucination),以 2018 年Journal of Neuroscience 發(fā)表的文章為例,被試在讀過“kick”這個詞后,把耳邊播放的“pick”錯聽成了“kick”。幻覺現(xiàn)實以一種可預測的方式帶給我們決定性的進化優(yōu)勢,當我們在無序復雜的世界中渴求有序時所需要的優(yōu)勢。 the conversation 目前學者們?nèi)栽诩ち业貭幷撛摾碚摰挠行?,以及大腦是如何在功能層面實現(xiàn)貝葉斯推理的問題。在定下任何明確的結(jié)論之前,還需要大量深入的研究。但我認為該理論以及現(xiàn)有證據(jù)的美妙之處在于,可以讓我們意識到人類正走在越來越好的軌道上。 我們離這個宇宙最神秘之物的真相越來越近了,它使我們能夠觀察世界并遨游其中,它掌握著我們的生死,也引導我們走向美好的未來(讀到這里你很有可能知道我會怎么結(jié)束這段話了):我們的貝葉斯腦。 |
|
|