电竞比分网-中国电竞赛事及体育赛事平台

分享

吳恩達(dá)最新解讀 DeepSeek:中國 AI 后來居上,開源模型引領(lǐng)變革

 你好122 2025-01-31
吳恩達(dá)最新解讀 DeepSeek:中國 AI 后來居上,開源模型引領(lǐng)變革

吳恩達(dá)是人工智能和機(jī)器學(xué)習(xí)領(lǐng)域的國際知名專家。他曾任百度首席科學(xué)家,主導(dǎo)百度的人工智能研究與應(yīng)用。在谷歌期間,他參與開發(fā)谷歌大腦項(xiàng)目。他創(chuàng)辦的在線教育平臺(tái) Coursera,提供大量 AI、機(jī)器學(xué)習(xí)課程,推動(dòng)相關(guān)知識(shí)普及。還著有《深度學(xué)習(xí)》一書,為從業(yè)者提供理論與實(shí)踐指導(dǎo)。他最近在
https://www./平臺(tái)上發(fā)表了對(duì)DeepSeek的評(píng)論。

吳恩達(dá)最新解讀 DeepSeek:中國 AI 后來居上,開源模型引領(lǐng)變革

他最近在
https://www./平臺(tái)上發(fā)表了對(duì)DeepSeek的評(píng)論。認(rèn)為中國 AI 后來居上,開源模型引領(lǐng)變革,他的評(píng)價(jià)全文如下:

親愛的朋友們,

本周 DeepSeek 的討論讓許多人認(rèn)識(shí)到一些顯而易見的重要趨勢:(i) 中國在生成 AI 領(lǐng)域正在趕超美國,這對(duì) AI 供應(yīng)鏈產(chǎn)生了影響。(ii) 開放權(quán)重模型正在將基礎(chǔ)模型層商品化,這為應(yīng)用程序構(gòu)建者創(chuàng)造了機(jī)會(huì)。(iii) 擴(kuò)大規(guī)模并不是 AI 進(jìn)步的唯一途徑。盡管人們對(duì)處理能力的關(guān)注和炒作如火如荼,但算法創(chuàng)新正在迅速降低培訓(xùn)成本。

大約一周前,中國公司 DeepSeek 發(fā)布了 DeepSeek-R1,這是一個(gè)出色的模型,其基準(zhǔn)測試性能可與 OpenAI 的 o1 相媲美。此外,它是以開放權(quán)重模型的形式發(fā)布的,具有寬松的 MIT 許可證。上周在達(dá)沃斯,我收到了許多非技術(shù)商業(yè)領(lǐng)袖關(guān)于它的問題。周一,股市出現(xiàn)了“DeepSeek 拋售”:Nvidia 和其他一些美國科技公司的股價(jià)暴跌。(截至撰寫本文時(shí),它們已有所回升。)

我認(rèn)為 DeepSeek 讓很多人意識(shí)到了以下幾點(diǎn):

中國在生成式人工智能方面正在趕超美國。2022 年 11 月推出 ChatGPT 時(shí),美國在生成式人工智能方面遠(yuǎn)遠(yuǎn)領(lǐng)先于中國。印象變化很慢,所以最近我聽到美國和中國的朋友都說他們認(rèn)為中國落后了。但實(shí)際上,這種差距在過去兩年里迅速縮小了。借助 Qwen(我的團(tuán)隊(duì)已經(jīng)使用了幾個(gè)月)、Kimi、InternVL 和 DeepSeek 等來自中國的模型,中國顯然正在縮小差距,而在視頻生成等領(lǐng)域,中國似乎已經(jīng)處于領(lǐng)先地位。

我很高興 DeepSeek-R1 以開放權(quán)重模型的形式發(fā)布,其技術(shù)報(bào)告分享了許多細(xì)節(jié)。相比之下,許多美國公司通過大肆宣傳人類滅絕等假設(shè)的人工智能危險(xiǎn)來推動(dòng)監(jiān)管以扼殺開源?,F(xiàn)在很明顯,開源/開放權(quán)重模型是人工智能供應(yīng)鏈的關(guān)鍵部分:許多公司都會(huì)使用它們。如果美國繼續(xù)阻礙開源,中國將主導(dǎo)供應(yīng)鏈的這一部分,許多企業(yè)最終將使用反映中國價(jià)值觀而非美國價(jià)值觀的模型。

開放權(quán)重模型正在將基礎(chǔ)模型層商品化。 正如我之前所寫,LLM 代幣價(jià)格一直在 快速下跌 ,開放權(quán)重助長了這一趨勢,并為開發(fā)人員提供了更多選擇。OpenAI 的 o1 每百萬輸出代幣成本為 60 美元;DeepSeek R1 成本為 2.19 美元。這近 30 倍的差異讓許多人注意到了價(jià)格下跌的趨勢。

吳恩達(dá)最新解讀 DeepSeek:中國 AI 后來居上,開源模型引領(lǐng)變革

訓(xùn)練基礎(chǔ)模型并銷售 API 訪問權(quán)的業(yè)務(wù)很艱難。該領(lǐng)域的許多公司仍在尋找收回模型訓(xùn)練巨額成本的方法。文章“人工智能的 6000 億美元問題”很好地闡述了這一挑戰(zhàn)(但需要明確的是,我認(rèn)為基礎(chǔ)模型公司做得很好,我希望他們能成功)。相比之下,在基礎(chǔ)模型之上構(gòu)建應(yīng)用程序則帶來了許多巨大的商機(jī)。既然其他人已經(jīng)花費(fèi)數(shù)十億美元訓(xùn)練此類模型,您只需花費(fèi)幾美元就可以訪問這些模型,以構(gòu)建客戶服務(wù)聊天機(jī)器人、電子郵件摘要器、AI 醫(yī)生、法律文件助理等等。

擴(kuò)大規(guī)模并不是 AI 進(jìn)步的唯一途徑。 關(guān)于擴(kuò)大模型規(guī)模作為推動(dòng)進(jìn)步的方式,人們大肆炒作。公平地說,我是擴(kuò)大模型規(guī)模的早期 支持者 。許多公司通過制造這樣的謠言籌集了數(shù)十億美元:有了更多的資本,它們就可以 (i) 擴(kuò)大規(guī)模和 (ii) 可預(yù)測地推動(dòng)改進(jìn)。因此,人們非常關(guān)注擴(kuò)大規(guī)模,而不是采取更細(xì)致入微的觀點(diǎn),充分關(guān)注我們可以取得進(jìn)步的許多不同方式。在一定程度上,在美國 AI 芯片禁運(yùn)的推動(dòng)下,DeepSeek 團(tuán)隊(duì)不得不在許多優(yōu)化方面進(jìn)行創(chuàng)新,以便在性能較差的 H800 GPU 而不是 H100 上運(yùn)行,最終導(dǎo)致模型的訓(xùn)練(不包括研究成本)計(jì)算成本低于 600 萬美元。

這是否真的會(huì)減少對(duì)計(jì)算的需求還有待觀察。有時(shí),降低每單位商品的價(jià)格可以帶來更多美元用于購買該商品。我認(rèn)為,從長遠(yuǎn)來看,對(duì)智能和計(jì)算的需求幾乎沒有上限,因此我仍然看好人類將使用更多智能,即使智能變得更便宜。

我在社交媒體上看到了很多對(duì) DeepSeek 進(jìn)展的不同解讀,就好像這是一個(gè)羅夏墨跡測試,讓很多人將自己的意義投射到它上面。我認(rèn)為 DeepSeek-R1 具有尚未解決的地緣政治影響。而且它對(duì)人工智能應(yīng)用程序構(gòu)建者來說也很棒。我的團(tuán)隊(duì)已經(jīng)開始集思廣益,這些想法之所以成為可能,只是因?yàn)槲覀兛梢暂p松訪問一個(gè)開放的高級(jí)推理模型?,F(xiàn)在仍然是構(gòu)建的好時(shí)機(jī)!

繼續(xù)學(xué)習(xí),

吳恩達(dá)

2025年1月30日

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請遵守用戶 評(píng)論公約

    類似文章 更多