电竞比分网-中国电竞赛事及体育赛事平台

分享

DeepSeek告訴我們:炒股比大模型難

 老鷹666 2025-02-11 發(fā)布于重慶

關(guān)于DeepSeek的評(píng)論已經(jīng)是鋪天蓋地。

(如果你還沒(méi)看過(guò)對(duì)梁文鋒的兩篇訪問(wèn)——《揭秘DeepSeek:一個(gè)更極致的中國(guó)技術(shù)理想主義故事》和《瘋狂的幻方:一家隱形AI巨頭的大模型之路》,那你肯定應(yīng)該先看這兩篇文章。所有對(duì)于DeepSeek的了解,都沒(méi)有直接聽(tīng)聽(tīng)梁文鋒自己怎么說(shuō),更直接。)

而在大量的網(wǎng)上討論中,有兩個(gè)在我看來(lái)是常見(jiàn)的誤解,似乎被提及的還不多,可以再討論一下。

AI的門(mén)檻不是很高

技術(shù)門(mén)檻不高

一講到AI,很多人馬上就可能會(huì)覺(jué)得是高深莫測(cè)。

實(shí)際上,AI技術(shù)發(fā)展至今,重大的理論突破并不多。

今天所有語(yǔ)言大模型所基于的Transformer架構(gòu),相關(guān)論文發(fā)表于2017年,距今已差不多有8年歷史。

在這8年時(shí)間里,大語(yǔ)言模型取得了突飛猛進(jìn)的進(jìn)展,當(dāng)然是因?yàn)閷?shí)現(xiàn)了一次又一次的技術(shù)突破,包括這次DeepSeek所做的一系列創(chuàng)新。

但這些突破都是屬于遞增改良式,所需要的理論基礎(chǔ),基本都是在大學(xué)本科知識(shí)范圍內(nèi)。

而且,像英偉達(dá)、微軟這些軟硬件供應(yīng)商,都會(huì)提供各種資源,努力幫助你降低技術(shù)門(mén)檻。

所以,DeepSeek所招聘的人員,用梁文鋒的話說(shuō),“都是一些Top高校的應(yīng)屆畢業(yè)生、沒(méi)畢業(yè)的博四、博五實(shí)習(xí)生,還有一些畢業(yè)才幾年的年輕人?!?/span>

這些人員在加入團(tuán)隊(duì)之前,基本都沒(méi)有什么AI方面的專業(yè)知識(shí)。

人員配備門(mén)檻也不高

雖說(shuō)DeepSeek所謂500~600萬(wàn)美元的訓(xùn)練成本,僅僅是最后一次訓(xùn)練的算力成本,并沒(méi)有包括前期的大量研發(fā)投入,但基礎(chǔ)大模型的整體開(kāi)發(fā)成本,還是在很多機(jī)構(gòu)的承擔(dān)范圍內(nèi)。

DeepSeek團(tuán)隊(duì)100多人,相對(duì)一些動(dòng)輒數(shù)百幾千團(tuán)隊(duì)的頭部AI大廠而言,人數(shù)確實(shí)不多。

但一些大廠團(tuán)隊(duì)中,還包括很多是商業(yè)團(tuán)隊(duì)人員。

核心研發(fā)人員,并不是必須要這么多人。

幾十人團(tuán)隊(duì)開(kāi)發(fā)的基礎(chǔ)大模型,并不罕見(jiàn)。

頭部AI公司Mistral AI融資之后,目前總員工人數(shù)也只是200人出頭。

資金門(mén)檻也不算太高

就算力來(lái)說(shuō),目前國(guó)內(nèi)H800/80G顯卡價(jià)格在20萬(wàn)左右。

圖片

要搭載一萬(wàn)塊的話,就要20個(gè)億,確實(shí)不是一筆小數(shù)目。

但是,這個(gè)是一次性固定投入。

固定投入攤銷(xiāo),再加上運(yùn)維成本,平均到每年需要多少算力成本開(kāi)支,我不知道具體數(shù)字,但可以根據(jù)幻方基金的經(jīng)營(yíng)規(guī)模做出上限的推算。

假設(shè)這些年來(lái)幻方量化的平均管理規(guī)模是500億,平均每年收益 12%。

以2%管理費(fèi)、20%業(yè)績(jī)提成來(lái)推算的話,幻方量化的平均每年的營(yíng)業(yè)收入就是500x0.02+500x0.12x0.2=22億。

但這是基金的全部收入,要扣除掉基金的各種運(yùn)營(yíng)成本之后的盈余,才能投入到AI研發(fā)中。

就算基金運(yùn)營(yíng)和DeepSeek研發(fā)中有很多資源可以共享,每年DeepSeek相關(guān)研發(fā)的支出,應(yīng)該不會(huì)超過(guò)10個(gè)億。

10個(gè)億當(dāng)然不是一個(gè)小數(shù)目,但也是在很多公司的預(yù)算范圍之內(nèi)。

且不說(shuō)像字節(jié)騰訊阿里這樣的頭部大廠,像快手這樣的“腰部”公司,每年的研發(fā)支出也要160多億。

難點(diǎn)在效率

但門(mén)檻不高不等于容易——開(kāi)餐館沒(méi)有門(mén)檻,但有幾個(gè)人能開(kāi)得成功?

AI研發(fā)的真正難點(diǎn)在于效率——如何有效地用好GPU集群進(jìn)行訓(xùn)練和推算,如何有效地對(duì)數(shù)據(jù)進(jìn)行收集、清理和標(biāo)注。

提升效率,不僅是為了降低成本,更是為了縮短研發(fā)周期,提升成功的概率。

更高的效率、更短的周期,才能有更多的對(duì)新想法的嘗試和檢驗(yàn)機(jī)會(huì),也才會(huì)就有更多的突破機(jī)會(huì)。

結(jié)論:大模型缺乏護(hù)城河

未來(lái)AI發(fā)展的前景,有很大的不確定性。

今天領(lǐng)先的大模型,隨時(shí)可能會(huì)被突然冒出來(lái)的新秀所取代。

而對(duì)于這一點(diǎn),可能沒(méi)有誰(shuí)比DeepSeek自己更清楚。

所以梁文鋒選擇把DeepSeek充分開(kāi)源,壓注自己的機(jī)構(gòu)組織能力,而不是技術(shù)和資金的壁壘——因?yàn)樗?,這些壁壘并不存在。

而DeepSeek最大的貢獻(xiàn),可能還不是技術(shù)上,而是在思想上:

  • 加強(qiáng)了中國(guó)人自主前沿創(chuàng)新的信心;

  • 觸發(fā)了如何建立前沿創(chuàng)新團(tuán)隊(duì)的反思。

AI炒股很難賺錢(qián)

對(duì)于一個(gè)脫胎于量化基金的團(tuán)隊(duì),能夠在前沿AI領(lǐng)域大放異彩,很多股民的第一反應(yīng)是:面對(duì)這樣的對(duì)手,我們還有什么賺錢(qián)機(jī)會(huì)?

但其實(shí),一家量化基金巨頭,決定轉(zhuǎn)戰(zhàn)AI大模型,也可以理解為AI炒股面臨瓶頸的表現(xiàn)。

幻方從2023年開(kāi)始加大對(duì)AI大模型研發(fā)的投入,一方面應(yīng)該是受到2022年底發(fā)布的ChatGPT的激勵(lì),另一方面也很可能和2021年以來(lái),基金表現(xiàn)欠佳有關(guān)。

恰恰因?yàn)槭橇炕?/span>

DeepSeek橫空出世之后,很多人驚異于一家量化基金,竟然能夠做出挑戰(zhàn)頭部AI大廠的成績(jī)。

但實(shí)際上,量化機(jī)構(gòu)做AI,有著獨(dú)特優(yōu)勢(shì)。

AI研發(fā)的核心難點(diǎn)在效率,而量化基金的核心技術(shù)能力之一,恰恰就是效率。

如果你看過(guò)劉易斯的《高頻交易員》一書(shū)就會(huì)知道,量化基金為了節(jié)約千分之四秒的時(shí)間,可以重鋪一條1300多公里的光纜通訊線。

而在量化基金之中,幻方又是很早就開(kāi)始加大對(duì)AI驅(qū)動(dòng)策略的研究投入。

據(jù)報(bào)道,幻方2019年就購(gòu)入了1100塊GPU,2021年又購(gòu)入1萬(wàn)片A100。

幻方對(duì)于如何優(yōu)化AI訓(xùn)練和推理算法,從來(lái)都不陌生。

梁文鋒本身又是電子工程出身,相對(duì)于單純理論學(xué)科出身的人,更多了一份兼通軟硬件的優(yōu)勢(shì)。

這次DeepSeek所發(fā)表的論文,也是罕見(jiàn)地(相對(duì)AI論文而言)專門(mén)針對(duì)硬件設(shè)計(jì),進(jìn)行了討論和建議。

從量化投資轉(zhuǎn)戰(zhàn)到AI大模型,很多技術(shù)可以說(shuō)是順滑平移。

由此而言,這次DeepSeek以量化基金背景的脫穎而出,又可以說(shuō)是情理之中。

沒(méi)轉(zhuǎn)化為投資收益優(yōu)勢(shì)

但是,從投資結(jié)果來(lái)看,盡管幻方肯定是屬于國(guó)內(nèi)頭部量化機(jī)構(gòu),但相對(duì)其他沒(méi)有那么多AI投入的量化機(jī)構(gòu)來(lái)說(shuō),并沒(méi)有表現(xiàn)出絕對(duì)的收益優(yōu)勢(shì)。

從媒體披露的收益走勢(shì)來(lái)看,幻方基金2016年以來(lái)的表現(xiàn),確實(shí)是遠(yuǎn)遠(yuǎn)跑贏大盤(pán)。但這些超額收益,主要是在2021年之前創(chuàng)造。

圖片

在2021年期間,基金表現(xiàn)出現(xiàn)大幅回撤,甚至導(dǎo)致幻方量化公開(kāi)表示道歉。

在這之后,基金的表現(xiàn)也是波動(dòng)較大。

雖然還是戰(zhàn)勝大盤(pán),但也僅僅是基本持平。

難點(diǎn)在數(shù)據(jù)

目前備受矚目的這些AI成果,都是基于神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)技術(shù)。

但深度學(xué)習(xí)的核心技術(shù),已經(jīng)存在了30多年,為什么要到最近10多年里,才能夠大放異彩呢?

原因在于算力和數(shù)據(jù)的提升。

OpenAI的GPT-3,用了500Gb的文本訓(xùn)練數(shù)據(jù),而GPT-4更是用了數(shù)萬(wàn)億的標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練。

但在股票市場(chǎng),如何有5000個(gè)股票,一年交易250天,要交易100年,才會(huì)有1.25億條日交易數(shù)據(jù)。

只有當(dāng)我們把交易數(shù)據(jù)進(jìn)一步細(xì)化到分鐘、秒鐘,甚至單筆時(shí),才能夠讓交易數(shù)據(jù)量大幅增加,可能滿足到AI訓(xùn)練的需要。

但這時(shí)馬上就會(huì)遇到市場(chǎng)容量的問(wèn)題。

交易時(shí)間跨度越短,交易額就越小,所能夠容納的交易資金量也就越少。

結(jié)論:交易頻率越低,AI優(yōu)勢(shì)越小

如果你是要盯著股票行情實(shí)時(shí)看盤(pán),高頻交易的話,你的對(duì)手就可能是越來(lái)越聰明的AI對(duì)手,你的賺錢(qián)機(jī)會(huì)就可能越來(lái)越少。

但如果你的投資周期較長(zhǎng),是以月、以年來(lái)計(jì)算的話,那你就不必為遇到AI對(duì)手而擔(dān)心。

至少以現(xiàn)有的AI技術(shù),很難有足夠的數(shù)據(jù)訓(xùn)練出值得你害怕的AI對(duì)手。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多