电竞比分网-中国电竞赛事及体育赛事平台

分享

圍棋是有缺陷的游戲?圍棋的博弈論與納什均衡

 月滿大江流 2021-04-30

約翰納什是個非常著名也非常傳奇的人物,他的著名也來源于他的傳奇。約翰納什出生于1928年,在21歲的時候,約翰納什就以一篇僅僅27頁的論文獲得了博士學(xué)位。其中有一項重要的發(fā)現(xiàn),就是后來被稱為“納什均衡”的博弈理論。約翰納什在1994年獲得了諾貝爾經(jīng)濟學(xué)獎。

約翰納什更為最出名的就是他因精神分裂導(dǎo)致瘋癲,1958年,30歲的約翰納什開始陷入了臆想的空虛世界,分不清虛幻和現(xiàn)實了。直到80年代末期,納什才漸漸康復(fù),從瘋癲中蘇醒。這段時間長達30年。

圍棋是有缺陷的游戲?圍棋的博弈論與納什均衡

普林斯頓學(xué)院對約翰納什體現(xiàn)出了極大的容納,對科學(xué)家的極大尊重是美國強大的原因之一。更令人感動的是,約翰納什的妻子也是他的學(xué)生艾里西亞一直沒有放棄他,即便是后來實在無法忍受約翰納什的狂躁瘋癲被迫離婚,也沒有再婚,而是一直在默默照顧他,直到納什蘇醒。

圍棋是有缺陷的游戲?圍棋的博弈論與納什均衡

這段感人的故事被好萊塢拍成了電影,這就是《美麗心靈》,該片于2001年12月21日在美國上映,并獲得了第74屆奧斯卡金像獎最佳影片獎。

在影片中,還是大學(xué)生的約翰納什和同學(xué)在下圍棋,他邊下邊說“我的每一步時都最優(yōu),我一定可以贏你”,但結(jié)果卻是納什輸了,納什表現(xiàn)出對結(jié)果的無法理解和無法接受,他推倒了棋盤,在同學(xué)的哄笑中慌亂生氣的走了,一邊走一邊說“圍棋是個有缺陷的游戲”。

圍棋是有缺陷的游戲?圍棋的博弈論與納什均衡

細心的觀眾會發(fā)現(xiàn)電影中的對局基本就是在亂下,這個情節(jié)只是為了突出博弈的特點,也就是對弈中對手的選擇會根據(jù)你的選擇發(fā)生變化,并不是靜止的一直能線性演進下去。

我們試著推演一下圍棋和博弈論的關(guān)系。

“博弈論”是一種研究“斗爭”的科學(xué),是探究在“自利”的大前提下,個體如何獲得最大收益的策略。其實圍棋就是一種斗爭的游戲,最終也是要以雙方圍空的多少分出勝負。

博弈論中的核心就是大名鼎鼎的“納什均衡”,納什均衡中最經(jīng)典的案例就是廣為人知的“囚徒困境”

圍棋是有缺陷的游戲?圍棋的博弈論與納什均衡

兩個共謀犯罪的人被關(guān)入監(jiān)獄,不能互相溝通情況。如果兩個人都不揭發(fā)對方,則由于證據(jù)不確定,每個人都坐牢一年;若一人揭發(fā),而另一人沉默,則揭發(fā)者因為立功而立即獲釋,沉默者因不合作而入獄十年;若互相揭發(fā),則因證據(jù)確鑿,二者都判刑八年。由于囚徒無法信任對方,因此傾向于互相揭發(fā),而不是同守沉默。

我們簡單了解一下什么是“納什均衡”?

納什均衡(Nash equilibrium)又稱非合作博弈均衡,是指在一個博弈過程中,無論對方的策略選擇如何,當事人一方都會選擇某個確定的策略,則該策略被稱作支配性策略。如果任意一位參與者在其他所有參與者的策略確定的情況下,其選擇的策略是最優(yōu)的,那么這個組合就被定義為納什均衡。

納什均衡可以分成兩類:“純戰(zhàn)略納什均衡”和“混合戰(zhàn)略納什均衡”。

混合戰(zhàn)略博弈均衡中要用概率計算,因為每一種策略都是隨機的,達到某一概率時,可以實現(xiàn)支付最優(yōu)。因為機率是連續(xù)的,所以即使戰(zhàn)略集合是有限的,也會有無限多個混合戰(zhàn)略。

圍棋可以看做是一個混合戰(zhàn)略博弈均衡。由于AI的引入,大家對圍棋中的勝率其實也就是“獲勝的概率”已經(jīng)很熟悉了。

圍棋是有缺陷的游戲?圍棋的博弈論與納什均衡

圍棋是兩個人之間的非合作博弈游戲,兩個人每一個回合都是一個混合戰(zhàn)略,一盤棋就是一個上百甚至數(shù)百個回合的混合戰(zhàn)略集合。每個回合實際都有一個最優(yōu)解,以前由于人們的水平不同,理解也不同,所以很難給出最優(yōu)解。阿法狗出現(xiàn)后,它給出的勝率基本就是每個回合的最優(yōu)解了,因為它戰(zhàn)勝了所有的人類棋手,大家不得不信服。之所以說基本,是因為人類棋手偶爾也會下出比AI更好勝率更高的棋來。這也從另一個角度證明了圍棋的復(fù)雜程度。

AI能戰(zhàn)勝人類棋手,就是因為它在每一個博弈回合都取得了最優(yōu)解,也就是勝率最高的下法,這些勝率持續(xù)累加起來自然也就是取得了勝利。

人類棋手則很難做到這一點,除了計算力和判斷力的原因,還有就是人類總想下自己喜歡的棋,喜歡的棋并不代表是勝率最高的棋。舉例來說,日本超一流武宮正樹九段酷愛“宇宙流”下法,但現(xiàn)在的AI根本不推薦宇宙流,這樣人類棋手就會很痛苦。站在博弈論的角度也很好理解,在水平相當也就是認知能力相當?shù)那闆r下,你想下的棋,一定是對手千方百計不讓你走到的棋,所以現(xiàn)在的圍棋基本沒有定式了。

我們再回到文章開頭,約翰納什認為自己每一步下法都是最優(yōu)解,他理所應(yīng)當會取得最后的勝利,但實際上,他認為的最優(yōu)解可能并不是真正的最優(yōu)解,用圍棋行話說就是“判斷失誤”,所以輸?shù)袅恕?/p>

不是圍棋游戲有缺陷,而是人們的認知水準有缺陷?!扒敉嚼Ь场钡某闪⑶疤峋褪莾蓚€罪犯對彼此的認知不同,也就是雙方都不相信對方能死扛,也就是信息不對稱,所以寧肯獲得8年刑期,也不冒險獲得10年刑期。

圍棋是有缺陷的游戲?圍棋的博弈論與納什均衡

“知己知彼,百戰(zhàn)不殆”,實際早在2000年前,孫子就已經(jīng)告訴世人,信息的獲取能力才是博弈獲勝與否的關(guān)鍵。

    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多