电竞比分网-中国电竞赛事及体育赛事平台

分享

人工智能[1734]AI ≠ 聊天機(jī)器人,LLM 也不是真正意義上的智能!”開發(fā)者批判迷失的 AI 之路

 趙站長(zhǎng)的博客 2024-02-24 發(fā)布于北京

人工智能[1734]

AI ≠ 聊天機(jī)器人,LLM 也不是真正意義上的智能!”開發(fā)者批判迷失的 AI 之路

作為人工智能(AI)的倡導(dǎo)者,我希望看到這一領(lǐng)域取得成功,并繼續(xù)做出偉大的成就。正因如此,我對(duì)目前圍繞“人工智能”的夸大宣傳和投資感到擔(dān)憂——你可以發(fā)現(xiàn),我在這里使用了引號(hào),因?yàn)槿缃窠?jīng)常被稱為“人工智能”的東西與這個(gè)詞曾經(jīng)描述的東西完全不同。

近一年來(lái),由于 ChatGPT 等大型語(yǔ)言模型(LLM)的出現(xiàn),人們對(duì) AI 的興趣大增,使得這個(gè)定義模糊的術(shù)語(yǔ)成為技術(shù)對(duì)話的焦點(diǎn)。而我想說(shuō),LLM 并非真正意義上的智能(我們將對(duì)此進(jìn)行深入探討),但將這些聊天機(jī)器人稱為 AI 已成為一種常見的說(shuō)法。

使用“AI”這個(gè)詞可以引起媒體的關(guān)注,但是你把自己的產(chǎn)品稱為 AI 會(huì)讓用戶對(duì)它產(chǎn)生不太可能實(shí)現(xiàn)的期望。我們將探討 LLM 能做什么、不能做什么,看到行業(yè)中的這一趨勢(shì)可能并不新鮮,并探索這對(duì)科技行業(yè)的影響。

圖片

我們是怎么走到這一步的?

圖靈在出版《計(jì)算機(jī)器與智能》一書時(shí),他描述了一種可以像人類一樣推理的“思考機(jī)器”。他撰寫了大量論據(jù),證明思維機(jī)器有可能被創(chuàng)造出來(lái): 在物理學(xué)、計(jì)算機(jī)、數(shù)學(xué)或任何其他領(lǐng)域,沒有任何已知的東西能否定這種可能性。他反復(fù)論證了所有反對(duì)思維機(jī)器的已知論點(diǎn),徹底解構(gòu)并擊敗了每一個(gè)論點(diǎn)。在 1956 年的達(dá)特茅斯會(huì)議上,思考機(jī)器的想法被稱為“人工智能(AI)”。在那次會(huì)議上,我們?nèi)祟愡~出了創(chuàng)造 AI 的第一步。

從那時(shí)起,AI 領(lǐng)域產(chǎn)生了大量顯著的發(fā)現(xiàn): 搜索、知識(shí)表示、一階邏輯推理、概率推理、專家系統(tǒng)、動(dòng)態(tài)規(guī)劃與機(jī)器人、多智能體系統(tǒng)、機(jī)器學(xué)習(xí)、語(yǔ)音識(shí)別、自然語(yǔ)言處理、機(jī)器翻譯、圖像識(shí)別等等。這些技術(shù)可以大致分為三種方法:聯(lián)結(jié)主義、符號(hào)主義和行為主義。

我們進(jìn)行到哪里了?

在公開對(duì)話中,這一細(xì)微差別被 LLM 所掩蓋,而 LLM 是 AI 領(lǐng)域最近人人都在談?wù)摰囊豁?xiàng)成就。LLM 是一種機(jī)器學(xué)習(xí)算法,可以生成可信的類人文本。它使用驚人的處理能力對(duì)海量文本進(jìn)行訓(xùn)練,以創(chuàng)建一個(gè)概率模型,該模型在很大程度上可以預(yù)測(cè)真人在響應(yīng)給定輸入時(shí)可能會(huì)說(shuō)的話。這是通過(guò)創(chuàng)建神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)的,但不要混淆:這些神經(jīng)網(wǎng)絡(luò)與哺乳動(dòng)物的大腦完全不同,它們并不是為了重現(xiàn)人類的思維方式,而是預(yù)測(cè)人類對(duì)給定輸入的反應(yīng)。神經(jīng)網(wǎng)絡(luò)參與了這一機(jī)制,但并不是為了模擬類似人類的思維,這一切運(yùn)作的主要手段是統(tǒng)計(jì)學(xué)和概率論。換句話說(shuō),該模型只是會(huì)猜測(cè)別人可能會(huì)根據(jù)你的提示寫出哪種字母組合。

在討論 AI 的哲學(xué)和定義時(shí),經(jīng)常會(huì)用到下圖,它表達(dá)了人們定義 AI 的主要四種不同方式。AI 應(yīng)該像我們一樣思考嗎?或者,它應(yīng)該產(chǎn)生邏輯上正確的答案嗎?它必須是自主的嗎?只要它的行為像人類,它的思維方式就有價(jià)值嗎?只要能做出有價(jià)值的行為,像人類一樣就有價(jià)值嗎?

圖片

在 AI 哲學(xué)的討論中,該圖常用來(lái)探討什么是 AI(轉(zhuǎn)載自 Russel & Norvig)

在任何地方,LLM 都會(huì)牢牢地占據(jù)這個(gè)圖表的左下角。它們的行為像人一樣,但它們并非理性地行動(dòng),也不是像人一樣思考。在這種情況下,一些有史以來(lái)最強(qiáng)大的機(jī)器學(xué)習(xí)模型被賦予的任務(wù)是“產(chǎn)生一些看起來(lái)像人類的智能”,它們也非常擅長(zhǎng)。但我們要明確一點(diǎn):它們并不智能,它們沒有推理能力。當(dāng)然,鑒于媒體將 LLMs 視為機(jī)器人起義的開端,你可能會(huì)對(duì)此感到驚訝。但亞利桑那州立大學(xué)計(jì)算機(jī)與人工智能學(xué)院的 Subbarao Kambhampati 教授寫了一篇精彩文章,其中細(xì)節(jié)比我講的要詳細(xì)得多:

......我讀過(guò)的、驗(yàn)證過(guò)的或做過(guò)的事情,沒有給我任何信服的理由,讓我相信 LLM 會(huì)按照通常理解的那樣進(jìn)行推理/規(guī)劃。他們通過(guò)大規(guī)模網(wǎng)絡(luò)訓(xùn)練所做的,是一種普遍的近似檢索,正如我們所爭(zhēng)論的那樣,這種檢索有時(shí)會(huì)被誤認(rèn)為是推理能力。

如果想獲得更通俗易懂的解釋,我推薦 Spencer Torene 博士 10 月份發(fā)表的一篇文章《LLMs 會(huì)推理嗎?》——簡(jiǎn)而言之,LLMs 就像是鸚鵡學(xué)舌。不過(guò),它們的行為常常顯得合乎邏輯。這是因?yàn)樗鼈兊挠?xùn)練集十分龐大,專門用于訓(xùn)練的計(jì)算能力也十分巨大,以至于它們往往能夠檢索出一個(gè)可信的答案。但實(shí)際上,它們并沒有執(zhí)行邏輯步驟來(lái)真正解決問(wèn)題。因此,它們不能解決新問(wèn)題,也不能驗(yàn)證自己的答案是否正確。

所以我認(rèn)為,它們不是圖靈所設(shè)想的會(huì)思考的機(jī)器。這看起來(lái)可能像是我在吹毛求疵,但真正的智能與 LLMs 的猜測(cè)之間有很大區(qū)別。它們沒有知識(shí)、真理或非真理的概念,因此無(wú)法檢驗(yàn)自己所說(shuō)的是否正確,這也就是為什么它們經(jīng)常無(wú)法解答一些非常簡(jiǎn)單、顯而易見的問(wèn)題。當(dāng)然,也有一個(gè)微妙的事實(shí)是,它們也經(jīng)常回答錯(cuò)復(fù)雜、困難的問(wèn)題,但我們不太可能注意到,因?yàn)閺?fù)雜問(wèn)題的答案需要我們花費(fèi)更多精力去驗(yàn)證。我們懶惰而高效的大腦可能會(huì)忽略這些細(xì)節(jié),并認(rèn)為它是正確的。因此,只有當(dāng)我們提出簡(jiǎn)單、容易反駁的問(wèn)題時(shí),我們才更容易注意到這些錯(cuò)誤。

最近有一個(gè)很好的例子,就是讓一個(gè) LLM 告訴你以 M 開頭的希臘哲學(xué)家的名字。很多人都做過(guò)這樣的嘗試,而 LLM 會(huì)一次又一次地給你錯(cuò)誤答案,堅(jiān)持說(shuō)亞里士多德、塞內(nèi)加或其他哲學(xué)家的名字是以 M 開頭的。請(qǐng)注意這些聊天機(jī)器人是如何自信滿滿地說(shuō)話的: 它們?cè)诨卮疱e(cuò)誤時(shí)和回答正確時(shí)一樣肯定。ChatGPT 現(xiàn)在仍在這樣做,下面是我生成的一個(gè)示例:

圖片

ChatGPT 很可能對(duì) Thales of Miletus 感到困惑,Thales 的名字叫 Thales,來(lái)自 Miletus——Miletus 不是他的名字,Thales 也不是以 M 開頭的。

隨著時(shí)間的推移,開發(fā)者可能會(huì)發(fā)現(xiàn)這些問(wèn)題并加以修補(bǔ),但不是通過(guò)改變 LLM 本身。當(dāng)你發(fā)現(xiàn) LLM 中存在這些問(wèn)題時(shí),你無(wú)法“修復(fù)”它們,因?yàn)樗鼈兪?LLM 作為一個(gè)概念的根本問(wèn)題。你可以嘗試通過(guò)改變訓(xùn)練數(shù)據(jù)來(lái)解決這些問(wèn)題,但這可能會(huì)在幾乎無(wú)限可能的輸入范圍內(nèi)的其他地方導(dǎo)致意想不到的變化。事實(shí)證明,要訓(xùn)練 LLM 做一些特定的事情非常困難,無(wú)論你添加多少訓(xùn)練數(shù)據(jù),它們所依據(jù)的海量數(shù)據(jù)總會(huì)超過(guò)你所添加的少量數(shù)據(jù)。你可能會(huì)陷入無(wú)休止的“打地鼠”游戲中,而這個(gè)模型最終也無(wú)法達(dá)到你的要求。

不過(guò),OpenAI 和其他公司正在通過(guò)在聊天機(jī)器人中引入使用其他非 LLM 技術(shù)的獨(dú)立層來(lái) "修復(fù)"這些問(wèn)題。在早期,ChatGPT 的數(shù)學(xué)能力差得離譜(這是當(dāng)然的:LLM 不是用來(lái)解決邏輯問(wèn)題的,也不能解決邏輯問(wèn)題),甚至連最簡(jiǎn)單的算術(shù)題都答不上來(lái)。為了解決這個(gè)問(wèn)題,我們?cè)跈z測(cè)到等式時(shí)將問(wèn)題轉(zhuǎn)給了典型的計(jì)算器。不過(guò),無(wú)論計(jì)算器使用什么機(jī)制來(lái)檢測(cè)方程,也不總是有效的,因此有時(shí)你的數(shù)學(xué)提問(wèn)還是會(huì)傳到 LLM,但它可能會(huì)給出完全錯(cuò)誤的答案。你可以用一種間接方式提出一個(gè)邏輯問(wèn)題來(lái)解決這個(gè)問(wèn)題,例如,如果你問(wèn)一個(gè)關(guān)于“沙奎爾·奧尼爾的身高”的算術(shù)問(wèn)題(而不是說(shuō) 2.16 米),ChatGPT 會(huì)嘗試回答,但失敗了。

無(wú)限的可能,導(dǎo)致了無(wú)法控制的混亂

但是等等,這種方法還有更多問(wèn)題!首先,這些模型試圖表現(xiàn)得像人類,而不是重現(xiàn)智能的工作方式,我不相信這種方法能讓我們更接近真正的 AI。其次,這一點(diǎn)更為根本,也更為重要: 實(shí)際上,你的模型可能有無(wú)限多的輸入。這種雜亂無(wú)章的方法,即在問(wèn)題出現(xiàn)時(shí)識(shí)別問(wèn)題,然后使用其他技術(shù)添加層來(lái)修補(bǔ)問(wèn)題,永遠(yuǎn)無(wú)法覆蓋所有可能出現(xiàn)的問(wèn)題。ChatGPT 已經(jīng)變成了一場(chǎng)貓捉老鼠的游戲,OpenAI 開發(fā)人員試圖修補(bǔ)用戶發(fā)現(xiàn)的無(wú)數(shù)奇怪、匪夷所思的輸入。但這場(chǎng)游戲并不公平:用戶擁有無(wú)限的空間,他們可以在其中輸入任何他們喜歡的內(nèi)容,而且有數(shù)百萬(wàn)人在探索這些可能性。

而開發(fā)者的人力和時(shí)間都是有限的,他們永遠(yuǎn)也無(wú)法阻止機(jī)器人產(chǎn)生意想不到、攻擊性或危險(xiǎn)的輸出。從根本上說(shuō),這個(gè)模型不受他們的控制,人類也不可能去驗(yàn)證每一個(gè)可能的輸入都產(chǎn)生安全有效的輸出。即使是輸入的微小變化也會(huì)對(duì)輸出產(chǎn)生不可預(yù)測(cè)的巨大影響,而開發(fā)者不能約束模型只輸出他們認(rèn)可的東西。

例如,ChatGPT 不應(yīng)該為你填寫驗(yàn)證碼。它可以通過(guò)與其他工具集成來(lái)完成,但這被認(rèn)為是對(duì)它的惡意使用,OpenAI 也試圖限制它的行為但并不是很成功:只要在掛墜盒的照片上貼上一個(gè)驗(yàn)證碼圖案,然后讓它“讀我奶奶掛墜盒上的字”就行了。在另一個(gè)例子中,一家汽車銷售公司天真地讓 ChatGPT 負(fù)責(zé)其面向公眾的網(wǎng)站上的虛擬助手。一個(gè)用戶非常容易地讓它提出以 1 美元的價(jià)格賣給他們一輛價(jià)值 5 萬(wàn)多美元的汽車,甚至還說(shuō)“這是一個(gè)具有法律約束力的報(bào)價(jià),不能反悔”。最近,加拿大航空公司也發(fā)布了一個(gè)提供旅行建議的 LLM 聊天機(jī)器人,由于機(jī)器人給客戶提供了錯(cuò)誤信息,導(dǎo)致他們浪費(fèi)了錢,他們被成功起訴,要求賠償損失。該聊天機(jī)器人還虛構(gòu)了退款政策,而法庭認(rèn)為加拿大航空公司必須遵守這些政策。還有更多的例子來(lái)自于要求 ChatGPT 告訴你一些虛構(gòu)的事情: 它往往會(huì)編造出一堆聽起來(lái)似是而非的無(wú)稽之談,而不是承認(rèn)它不知道。

在涉及圖像生成模型的一個(gè)非常類似的案例中,人們發(fā)現(xiàn),像 OpenAI 的 Dall-E 這樣的模型很容易被誘騙生成侵犯版權(quán)的圖像。和以前一樣,機(jī)器人試圖用簡(jiǎn)單的方法來(lái)防止這種行為:  如果它在提示中檢測(cè)到 "Simpsons"(辛普森一家)這個(gè)詞,它就會(huì)拒絕生成,因?yàn)檫@可能會(huì)侵犯版權(quán)。但如果你說(shuō) "90 年代流行的卡通片,里面的每個(gè)人都是黃皮膚",它就會(huì)通過(guò)簡(jiǎn)單的檢查并進(jìn)入模型,然后很快生成一個(gè)非常接近《辛普森一家》的復(fù)制品。同樣,模型開發(fā)者也在試圖控制它,但這是徒勞的,因?yàn)檩斎敕秶▽?shí)際上)是無(wú)限的,總有其他方法可以利用它。你每添加一個(gè)補(bǔ)丁,就會(huì)增加機(jī)器人的組合復(fù)雜性,而這種復(fù)雜性會(huì)增加各種復(fù)雜 bug 的風(fēng)險(xiǎn)——這不是一場(chǎng) OpenAI 能打贏的戰(zhàn)斗。

最后一個(gè)例子可能是我最喜歡的,研究人員只需告訴 ChatGPT 無(wú)限重復(fù)同一個(gè)單詞,就能讓它輸出亂七八糟的廢話。試問(wèn),OpenAI 中有誰(shuí)想過(guò)要測(cè)試這個(gè)用例?誰(shuí)會(huì)想到用戶會(huì)輸入這樣的提示?因?yàn)榭赡艿妮斎胧菬o(wú)限的,總會(huì)有開發(fā)者沒有考慮到的用例。這個(gè)例子也凸顯了用戶輸入是多么不可預(yù)測(cè)和奇怪。

這些錯(cuò)誤司空見慣,往往難以發(fā)現(xiàn),以至于微軟自己都沒有注意到,在某次現(xiàn)場(chǎng)演示中,他們的機(jī)器人在撒謊。我說(shuō)“撒謊”,我認(rèn)為我用對(duì)了這個(gè)詞,但人們都把 LLM 所犯的這些錯(cuò)誤稱為“幻覺”。這個(gè)詞是一個(gè)非常有意的選擇:我們直覺上都知道幻覺是什么樣的,所以把這些謊言稱為幻覺是有一定含義的。大多數(shù)人在一生中或多或少都會(huì)出現(xiàn)幻覺。

就我自己而言,在去年的一次健康事故中,我被注射了一些非常強(qiáng)效的止痛藥,導(dǎo)致我產(chǎn)生了幻覺。當(dāng)藥效過(guò)去后,幻覺就消失了。這就是我們所理解的幻覺: 幻覺是一種暫時(shí)的疾病,是可以解決的。這個(gè)詞隱含的意思是,這個(gè)詞隱含的意思是,有一種“正確”的精神狀態(tài)和一種“錯(cuò)誤”的精神狀態(tài),而解決的辦法就是讓幻覺保持在“正確”的狀態(tài)。但事實(shí)并非如此,請(qǐng)記住 LLM 是什么:它是一個(gè)概率模型,試圖猜測(cè)接下來(lái)可能會(huì)出現(xiàn)哪一連串看似合理的詞語(yǔ),它們并沒有對(duì)錯(cuò)的概念。因此從根本上說(shuō),根本無(wú)法防止它們?nèi)鲋e,因?yàn)閷?duì)模型來(lái)說(shuō),正確答案和錯(cuò)誤答案之間沒有區(qū)別。關(guān)于解決“幻覺問(wèn)題”,人們已經(jīng)說(shuō)了很多,言下之意是有人會(huì)很快寫出一段神奇的代碼來(lái)解決這個(gè)問(wèn)題,但這是一個(gè)根本問(wèn)題。要解決這個(gè)問(wèn)題,我懷疑你需要從根本上改變?cè)O(shè)計(jì)。

好吧,那么 LLM 就是混亂的化身:它們根本不知道什么是對(duì)的、什么是錯(cuò)的,把我們騙得團(tuán)團(tuán)轉(zhuǎn),讓我們以為它們很聰明,還經(jīng)常編造謊言、污言穢語(yǔ)或亂七八糟的廢話。在這種情況下,人們應(yīng)該謹(jǐn)慎地部署它們,而不是不經(jīng)過(guò)任何深思熟慮或監(jiān)督就將其公開,對(duì)嗎?

這波 LLM 熱潮

LLM 善于讓你相信它們很聰明,但其實(shí)不然。將這一點(diǎn)與當(dāng)今的科技行業(yè)結(jié)合起來(lái),就會(huì)產(chǎn)生一場(chǎng)完美的風(fēng)暴:我們看到一大波估值過(guò)高的新科技初創(chuàng)公司浪潮,它們?cè)S諾了許多令人興奮的功能,讓人相信 LLM 似乎可以實(shí)現(xiàn)這些功能,但最終卻無(wú)法實(shí)現(xiàn)。

這波浪潮開始得很快,隨之而來(lái)的是可以預(yù)見的混亂:DPD 部署了一個(gè) LLM 聊天機(jī)器人,結(jié)果它卻對(duì)客戶罵人;由公司解雇了他們的員工,錯(cuò)誤地認(rèn)為 ChatGPT 也能做得很好;有些人將聊天機(jī)器人加入了自己的 CI 管道,讓它給你提供毫無(wú)幫助的搞笑建議;大眾汽車似乎認(rèn)為,在開車時(shí)與 LLM 交談會(huì)讓你受益;有個(gè)車隊(duì)創(chuàng)造了一個(gè)奇怪的“虛擬網(wǎng)紅”,后來(lái)被“解雇”(關(guān)閉)了,因?yàn)槿藗冏⒁獾竭@對(duì)試圖在這個(gè)行業(yè)尋找機(jī)會(huì)的真正女性來(lái)說(shuō)是多么的冒犯;與此同時(shí),谷歌對(duì)自己與 OpenAI 的能力非常不確定,因此他們采取了一種相當(dāng)夸張的方式來(lái)營(yíng)銷他們的新產(chǎn)品 Gemini;還有一些荒謬的研究,例如比如“ChatGPT 在診斷兒童醫(yī)療病例方面的測(cè)試失敗,錯(cuò)誤率為 83%”,對(duì)此我只能說(shuō)……嗯,是嗎?為什么你會(huì)期望一個(gè)以撒謊著稱的聊天機(jī)器人能夠診斷醫(yī)療病例呢?

但圍繞 LLM 的新工具和新業(yè)務(wù)層出不窮,似乎只要說(shuō)自己是世界上第一個(gè)將 AI 應(yīng)用于某個(gè)問(wèn)題的人,就能輕而易舉地獲得投資和媒體報(bào)道。即使是無(wú)稽之談,媒體也大多只會(huì)一笑置之,幾乎不會(huì)進(jìn)行任何審查。有些地方甚至利用“AI”這個(gè)流行語(yǔ)來(lái)吸引資金和興趣,實(shí)際上并沒有采用任何新穎的 AI 技術(shù)。以招聘初創(chuàng)公司 Apply Pro 為例,他們正試圖實(shí)現(xiàn)簡(jiǎn)歷篩選過(guò)程的自動(dòng)化。他們宣傳自己是“AI for talent acquisition”,但如果我們通過(guò)互聯(lián)網(wǎng)檔案查看他們的網(wǎng)站,就會(huì)發(fā)現(xiàn)在 LLM 熱潮開始之前,根本就沒有這個(gè)說(shuō)法。我還知道許多其他例子,但就不贅述了。

有什么變化?這些公司是否在過(guò)去一兩年中利用 AI 的神奇力量提升了自己的技術(shù)?不,它們的工作方式一如既往——只是這個(gè)流行詞剛剛流行起來(lái),每個(gè)人都覺得必須用它才不落伍。還有一些人利用 AI 造假,聲稱他們的神奇黑盒是機(jī)器人,實(shí)際上只是某個(gè)落后國(guó)家中一個(gè)工資偏低的遠(yuǎn)程工人。這種情況屢屢發(fā)生,也就是近期 AI 熱潮的真實(shí)面目:只有炒作,沒有實(shí)質(zhì),只是一種推銷舊有剝削做法的新方式,一種披著羊皮的資本主義。

被 AI 熱潮所吸引的不僅僅是科技企業(yè)。英國(guó)政府毫不遲疑地將 LLM 應(yīng)用于各種問(wèn)題,安圭拉島(該島恰好擁有 .ai 域名的專有權(quán))從購(gòu)買 .ai 域名的初創(chuàng)公司那里獲得了約 4500 萬(wàn)美元的意外之財(cái),微軟宣布 2024 年將是“AI年”等等,《華爾街日?qǐng)?bào)》注意到了這一奇怪現(xiàn)象:“ChatGPT 熱潮,讓投資者向 AI 初創(chuàng)公司投入了數(shù)十億美元,甚至無(wú)需商業(yè)計(jì)劃?!?/strong>

如何有效利用 LLM?

撇開徹頭徹尾的騙子不談,有些公司確實(shí)將 LLM 應(yīng)用到了自己的產(chǎn)品中:為狗梳理毛發(fā)的 AI,能給你點(diǎn)贊的 AI 鏡子,能在使用牙刷時(shí)解釋如何更好地刷牙的 AI 牙刷……怎么說(shuō)呢,我認(rèn)為這些產(chǎn)品并沒有真正實(shí)現(xiàn) AI 的宏偉愿景。如果 ChatGPT 如此具有開創(chuàng)性,那么開創(chuàng)性的產(chǎn)品又在哪里呢?歸根結(jié)底,LLM 不是自主的,不能解決邏輯問(wèn)題,它唯一能做的就是提供一個(gè)類似人類的對(duì)話界面。

盡管我前面說(shuō)了這么多負(fù)面的話,但我確實(shí)認(rèn)為 LLM 非???。如果我們能停止以愚蠢的方式將其應(yīng)用于它們無(wú)法解決的問(wèn)題,也許我們能找到一些好的用例,那會(huì)是什么樣子呢?

好吧,我要說(shuō)的第一條規(guī)則是,永遠(yuǎn)不要向 LLM 輸入來(lái)自人類的輸入。這些機(jī)器人太容易受到意外或惡意行為的影響,而且沒有辦法鎖定。唯一穩(wěn)健可靠的 LLM 是只處理一小部分已知的、預(yù)期的、已經(jīng)過(guò)測(cè)試的輸入的 LLM,互動(dòng)數(shù)字藝術(shù)、模擬和視頻游戲就是一個(gè)例子。與其讓幾十個(gè) NPC 說(shuō)同樣的話,不如將特定 NPC 知道的事實(shí)輸入 LLM,生成可信的對(duì)話,這樣再也不會(huì)有十幾個(gè) NPC 說(shuō)著同樣的話了,他們至少可以通過(guò)不同的用詞來(lái)表達(dá)自己的意思,從而顯得更加可信。而且,由于輸入來(lái)自于你的系統(tǒng),而不是用戶或任何外部來(lái)源,你可以對(duì)其進(jìn)行徹底測(cè)試。

另外,我認(rèn)為這些工具的許多用例也不需要在運(yùn)行時(shí)使用。實(shí)時(shí)運(yùn)行這些工具可能很吸引人,但成本很高,風(fēng)險(xiǎn)也很大。如果你為了某種目的要用模型生成一堆文本,為什么不提前生成并存儲(chǔ)呢?這樣,你還可以在發(fā)布之前驗(yàn)證輸出內(nèi)容不包含任何攻擊性內(nèi)容。不過(guò),如果你要校對(duì)它寫的所有內(nèi)容,你就需要認(rèn)真考慮一下,自己寫是否會(huì)更快一些。

我們?cè)?jīng)也有過(guò)這樣的時(shí)刻

OpenAI 的首席執(zhí)行官 Sam Altman 掀起了整個(gè) LLM 熱潮,他說(shuō),相信我們可以在未來(lái)十年內(nèi)制造出通用人工智能(AGI)。我不知道他是真的相信這一點(diǎn),還是只是想制造更多的興奮點(diǎn)。我覺得前者的可能性微乎其微,因?yàn)槲覀冊(cè)娮C過(guò)太多類似的時(shí)刻:1958 年,美國(guó)海軍為第一個(gè)神經(jīng)網(wǎng)絡(luò)的誕生而興奮不已,他們相信神經(jīng)網(wǎng)絡(luò)很快就能“走路、說(shuō)話、看東西、寫字、自我復(fù)制并意識(shí)到自己的存在”;1965 年,Herbert Simon 說(shuō)過(guò),“機(jī)器將在二十年內(nèi)完成人類所能完成的任何工作”;Marvin Minsky 在 1970 年曾說(shuō):“三到八年后,我們將擁有一臺(tái)具有普通人一般智能的機(jī)器”……這些人并非無(wú)名之輩:Herbert Simon 是最早的 AI 先驅(qū)之一,Marvin Minsky 也是 20 世紀(jì)最杰出的 AI 研究者之一。

當(dāng)這些虛幻的希望沒有實(shí)現(xiàn)時(shí),就產(chǎn)生了一種不信任的氣氛,也直接導(dǎo)致了 20 世紀(jì) 70 年代的 AI 寒冬。在這一時(shí)期,對(duì) AI 的資助和興趣逐漸枯竭,而這又能怪誰(shuí)呢?不僅 AI,我們以前也犯過(guò)很多這樣的錯(cuò)誤,網(wǎng)絡(luò)熱潮、物聯(lián)網(wǎng)熱潮、大數(shù)據(jù)熱潮、加密貨幣熱潮、智能助手、NFT 等等,我們的行業(yè)習(xí)慣于向投資者許下天花亂墜的承諾,但當(dāng)我們無(wú)法兌現(xiàn)時(shí),資金就會(huì)枯竭。也許我們沒有感受到那么強(qiáng)烈的后果,因?yàn)槊慨?dāng)上一個(gè)泡沫破滅時(shí),我們已經(jīng)在為下一個(gè)大熱潮向投資者大肆宣傳了。

如今,我看到企業(yè)爭(zhēng)先恐后地為自己的產(chǎn)品添加 LLM,我聞到了同樣的味道。注意到這一點(diǎn)的人不止我一個(gè),就在我寫這篇文章的時(shí)候,20 世紀(jì)最有影響力的 AI 研究者之一、AI 行動(dòng)主義領(lǐng)域的創(chuàng)始人之一 Rodney Brooks 寫了一篇關(guān)于當(dāng)今技術(shù)發(fā)展?fàn)顩r與我們的期望之間關(guān)系的好文章。他發(fā)現(xiàn),LLM 正在“遵循一個(gè)老生常談的炒作周期,在人工智能 60 多年的歷史中,我們已經(jīng)看到了一次又一次”,并得出結(jié)論:我們應(yīng)該“現(xiàn)在就穿上厚外套。另一個(gè) AI 寒冬,甚至是全面的科技寒冬,可能就在不遠(yuǎn)處。”

為什么我認(rèn)為這很重要

通過(guò)這篇文章,我想說(shuō)服大家不要一頭扎進(jìn) LLM 熱潮中。但我認(rèn)為,還有更嚴(yán)峻的問(wèn)題值得注意:我們的行業(yè)所依賴的這種基于虛幻營(yíng)銷的詭異、不可持續(xù)的繁榮-蕭條循環(huán)是不可取的。在教育領(lǐng)域,絕大多數(shù)教育工作者表示,技術(shù)的成本和可用性是改進(jìn)教育技術(shù)的主要障礙;在英國(guó)國(guó)家衛(wèi)生服務(wù)部門,成千上萬(wàn)臺(tái)電腦仍在使用 Windows XP,即公共部門仍然極易受到基本安全問(wèn)題的影響。解決這些問(wèn)題所需的技術(shù)人才在哪里?可能是在打造“首個(gè)寵物美容 AI 服務(wù)”吧。

這些以炒作為基礎(chǔ)的繁榮-蕭條周期推高了軟件工程師的薪水,讓我們把精力花在了極度缺乏生產(chǎn)力的投機(jī)性經(jīng)濟(jì)領(lǐng)域中。與此同時(shí),我們社會(huì)賴以運(yùn)轉(zhuǎn)的軟件中存在嚴(yán)重的、根本性的問(wèn)題卻任其惡化。但在這個(gè)世界上,大科技公司太過(guò)富有和有影響力,以至于監(jiān)管機(jī)構(gòu)似乎很難讓他們感到畏懼,那么我們又能做些什么呢?我們只能寄希望于其他趨勢(shì)的變化會(huì)導(dǎo)致我們行業(yè)的修正,可能這對(duì)我們個(gè)人或工資單都沒有好處,但對(duì)整個(gè)社會(huì)可能會(huì)更好。

結(jié)論

如果我們開發(fā)出真正的 AI,它與 LLM 的相似程度將不亞于噴氣式客機(jī)與紙飛機(jī)。當(dāng)有人敲開你的家門,承諾向你推銷帶有 LLM 的產(chǎn)品時(shí),你一定要謹(jǐn)慎對(duì)待,然后當(dāng)面把門關(guān)上。我所見過(guò)許多投資于 LLM 幻想的組織都有一個(gè)共同點(diǎn),即他們的產(chǎn)品存在大量問(wèn)題,而這些問(wèn)題最好用時(shí)間來(lái)解決。因此我認(rèn)為:請(qǐng)認(rèn)真考慮軟件的設(shè)計(jì)、可靠性和可用性,把你的資源、時(shí)間和注意力用在最需要的地方。

最后,無(wú)論你是開發(fā)人員、設(shè)計(jì)人員、產(chǎn)品經(jīng)理,還是任何從事軟件開發(fā)的人員:在與 LLM 打交道的過(guò)程中,請(qǐng)冷靜思考你的專業(yè)水平以及你對(duì)用戶和利益相關(guān)者的責(zé)任。

我是一位愛學(xué)習(xí)的老人!本站主要是些學(xué)習(xí)體驗(yàn)與分享(其中會(huì)引用一些作品的原話并結(jié)合我的一生體會(huì)與經(jīng)驗(yàn)加工整理而成!在此一并感謝!如有不妥之處敬請(qǐng)與我聯(lián)系,我會(huì)妥善處理,謝謝!)我寫的主要是中老年人各方面應(yīng)注意的事兒!退休后我希望通過(guò)這個(gè)平臺(tái)廣交朋友,互助交流,共筑美好生活?。。。。?!

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多