电竞比分网-中国电竞赛事及体育赛事平台

分享

對話火山引擎張鑫:AI Agent如何從「玩具」進(jìn)化為企業(yè)「生產(chǎn)力單元」

 TechForWhat 2025-06-22 發(fā)布于河北

作者 | 常棣

編輯 | 葛覃

2023年,企業(yè)捧著大模型如同獲得一把萬能鑰匙,卻始終打不開業(yè)務(wù)增長的大門。2025年,企業(yè)早已不滿足Chatbot式對話,轉(zhuǎn)而追求“生產(chǎn)力重塑”,抓手便是AI Agent。

AI Agent 已經(jīng)成為大模型時代的 “APP”,通常由感知器、知識庫、決策引擎和執(zhí)行器等關(guān)鍵組件構(gòu)成。感知器負(fù)責(zé)接收來自環(huán)境的信息,如圖像、聲音、文本等;知識庫存儲和管理 AI Agent 關(guān)于環(huán)境和自身狀態(tài)的信息;決策引擎分析感知的信息,并結(jié)合知識庫中的數(shù)據(jù),制定下一步的行動計劃;執(zhí)行器則根據(jù)決策引擎的指令執(zhí)行具體動作。這些組件相互協(xié)作,賦予了 AI Agent 感知、決策和行動的能力。

步入 2025 年,AI Agent 的應(yīng)用呈現(xiàn)出爆發(fā)式增長的態(tài)勢,已成為眾多企業(yè)提升效率、優(yōu)化運(yùn)營的得力助手。據(jù) Gartner 預(yù)測,到 2028 年,約 15% 的日常工作決策將由 Agentic AI 自主完成,而企業(yè)軟件應(yīng)用程序中包含 Agentic AI 的比例也將飆升至 33%,這一數(shù)據(jù)直觀地展示了 AI Agent 在未來幾年的廣闊發(fā)展空間。

但AI Agent是否可用、好用,不僅取決于大模型本身,尤其在企業(yè)級的核心生產(chǎn)場景中,企業(yè)不會為了技術(shù)或者工具付費(fèi),而是為了價值和效果付費(fèi)。一種觀點認(rèn)為,工程化對 AI 應(yīng)用的作用被低估了,當(dāng)不少目光聚焦在炫目的新技術(shù)層面,如何構(gòu)建一個好用的Agent,本身就更值得行業(yè)關(guān)注。

這場大模型時代的AI Agent競速,勝負(fù)不在技術(shù)參數(shù),而在誰先讓企業(yè)忘記“AI”二字,只看見生產(chǎn)力。近日TechForWhat對話了火山引擎副總裁張鑫,作為HIAgent智能體構(gòu)建平臺的負(fù)責(zé)人,他就企業(yè)級Agent的趨勢和觀點作了闡述。

以下為對話實錄,經(jīng)編輯:

問:在你看來,這兩年大模型或者說AI Agent行業(yè)經(jīng)歷了哪些變化?火山引擎Hi Agent誕生的背景是什么?

答:大模型的能力從高中生到現(xiàn)在開始步入到博士級,我最有感觸的一個事情,最早的時候我講智能體包括大模型局限總結(jié)過四大死穴,目前其實所有的死穴都已經(jīng)不在了。

智能體的能力邊界也在不斷的提升,它本身的表現(xiàn)形態(tài)也有很大變化。GPT剛出現(xiàn)的時候,很多人把chatbot和智能劃等號,今天有了很多新的概念,有AI Agent,Agentic AI等,聽起來像繞口令一樣,其實也代表著今天的智能體不光是能聊天,還能干活,有更強(qiáng)的自主性和思考。

不論是從能力邊界,還是產(chǎn)業(yè)的應(yīng)用場景,還是智能體本身的表現(xiàn)形態(tài)上,這兩年AI Agent都在變化。

去年5月15號火山引擎正式發(fā)布HiAgent,因為當(dāng)時我們看到另外一個本質(zhì)邏輯,包括火山引擎在內(nèi),行業(yè)對 AI的認(rèn)知也在發(fā)生變化,一開始所有精力都聚焦在預(yù)訓(xùn)練階段,那時候火山產(chǎn)品也是以做好算力基礎(chǔ)設(shè)施為主,做超大規(guī)模的GPU集群算力。

第二階段,我們覺得要做好工具和鏟子,當(dāng)時大模型還是一個百花齊放的階段,很多人都會做預(yù)訓(xùn)練和精調(diào),火山引擎又推出了火山方舟。再到下一階段,我們認(rèn)識到,真正要落地好大模型應(yīng)用,模型能力能決定一大部分,所以我們還是要做好基礎(chǔ)模型。

所以在去年5月15號又發(fā)布了豆包,我們想通過好的模型讓大家更容易構(gòu)建出好的應(yīng)用,再下一步,我們就發(fā)現(xiàn)有了好的模型,并不和應(yīng)用直接劃等號,中間其實是有一系列的工程化實踐,從提示詞工程到知識庫到工作流等等,那時候我們意識到要提供一個好的智能體開發(fā)平臺,把整個鏈路補(bǔ)全,就希望有HiAgent這樣的平臺出來。

問:在AI Agent還不是共識的時候,為什么火山引擎要提前做智能體構(gòu)建平臺?

答:本質(zhì)的邏輯還是希望讓豆包成為未來大家使用大模型的首選,但是豆包真正在行業(yè)里落地的時候,不是直接做問答就好,其實還是要基于它構(gòu)建很多不同的應(yīng)用。

早期我們也嘗試直接針對企業(yè)某個具體需求場景直接做應(yīng)用,但感覺又回到了傳統(tǒng)軟件的定制化交付。所以第一開始我們的想法很簡單,就是能不能幫我們自己提效,做出來以后發(fā)現(xiàn),由于大模型和AI等相關(guān)門檻降到很低,而且可以把很多通用操作抽象得很好,這對于企業(yè)也是有很大的價值,所以我們就把這樣一項能力就對外直接做產(chǎn)品化和商業(yè)化,讓企業(yè)自己也能夠被AI賦能,開發(fā)更多的智能體。

問:很多觀點都提到,2025年是Agent元年,Agent元年應(yīng)該是什么樣?

答:元年是比較樂觀的說法,我覺得一方面它最直觀的表現(xiàn)可能是智能體數(shù)量和行業(yè)覆蓋廣度的遍地開花,但這只是表象。Agent 爆發(fā)需要從幾個不同維度達(dá)到臨界點:

第一個是技術(shù)臨界點,就像我剛才說的,大模型能力的上限決定了智能體應(yīng)用效果的下限。現(xiàn)在大模型在不同領(lǐng)域都達(dá)到了博士生水平,才能支持 Agent 做更多自主思考和動態(tài)規(guī)劃,所以大模型本身要達(dá)到博士級水平是爆發(fā)的首要條件。

第二點是從商業(yè)和生態(tài)角度,Agent 最大的區(qū)別是會使用工具了,無論是通過 MCP 協(xié)議還是谷歌提出的 A2A 協(xié)議讓多 Agent 協(xié)同,這樣才能真正放大 Agent 的價值。但這需要整個生態(tài)體系更加完善,比如 MCP 只是一個協(xié)議,需要更多高質(zhì)量的參與者投入到生態(tài)中,才能讓 Agent 解決更多問題。

第三點是商業(yè)層面,就像預(yù)訓(xùn)練階段一樣,預(yù)訓(xùn)練本身是重投入的產(chǎn)業(yè)。對于 Agent 來說,2025 年很重要的一點是要走完商業(yè)閉環(huán)。當(dāng)前 Agent 調(diào)用成本很高,比如以 Minus 為例,完成一個普通任務(wù)可能消耗幾十塊人民幣,純 Token 調(diào)用就需要幾十塊,因為過程中涉及多個步驟和多次查詢。所以 Agent 要真正形成元年,不僅技術(shù)和生態(tài)要成熟,商業(yè)模式也要有好的落地場景。

其實到今天,AI 大模型的商業(yè)模式已經(jīng)經(jīng)歷了幾個階段:最初級階段是賣算力,按卡時收費(fèi),比如租多少卡按月或按年租賃;下一個階段是按 Token 收費(fèi),這是在算力基礎(chǔ)上疊加了大模型的能力,比如火山引擎很多產(chǎn)品按 Token 收費(fèi);再下一個階段是按使用量收費(fèi),即訂閱制,比如美國 OpenAI 的很多產(chǎn)品按每月訂閱、按坐席收費(fèi);最終我認(rèn)為智能體元年的爆發(fā)要看按效果收費(fèi),比如通過智能體做營銷,幫企業(yè)額外產(chǎn)生收益或節(jié)省成本。這幾個維度都具備了,2025 年才算 Agent 爆發(fā)的元年,而不僅僅是看數(shù)量和行業(yè)覆蓋廣度。

問:企業(yè)目前是否有額外的預(yù)算為Agent買單?

答:企業(yè)對 AI 投資的分配也有階段,一開始更多投資在算力建設(shè)上,買卡做模型部署;第二個階段體現(xiàn)在模型采購上,因為大家認(rèn)識到核心資產(chǎn)是模型;下一個階段越來越多企業(yè)意識到,算力單位成本在壓低,尤其是 AIGC 出現(xiàn)后,大家覺得可以用更高效的方式提升算力使用效率,甚至有企業(yè)認(rèn)為模型應(yīng)該免費(fèi),這得益于技術(shù)的普惠化。

現(xiàn)在更多企業(yè)意識到最終核心在于 Agent。但確實存在企業(yè)預(yù)算分配的問題,比如上一年做預(yù)算時,還停留在算力或模型層,這種情況下我們會和客戶探討分階段實施。

問:哪些客戶、哪些場景,先用上了AI Agent?

答:從接觸的客戶來看,有幾類場景和團(tuán)隊率先用上了 Agent:

第一類是知識密集型但老專家稀缺的場景,比如高校、科研、醫(yī)療、金融等領(lǐng)域做顧問類工作。

第二類是人力密集型、培訓(xùn)成本高且服務(wù)質(zhì)量參差不齊的場景,比如客服,需要大量人力,傳統(tǒng)培訓(xùn)方式下不同客服服務(wù)質(zhì)量不一,通過 AI 既能解決人力極限問題,又能提供更標(biāo)準(zhǔn)化的服務(wù),營銷導(dǎo)購場景也較多使用大模型。

第三類是 IT 密集型場景,因為大模型是新技術(shù),IT 密集型場景的專業(yè)技能接納度更高,比如代碼編程、運(yùn)維領(lǐng)域,大家用 Agent 更積極。

問:企業(yè)在使用HiAgent平臺之后,是自己就能跑起來,還是需要火山引擎的團(tuán)隊協(xié)助?

答:這是一個好問題,這次其實HiAgent更新的主題也是針對此。其實 Agent 的效果不是一次搭建的靜態(tài)結(jié)果,上線后就像新入職的新人,需要不斷調(diào)教、積累經(jīng)驗和反思,是一個持續(xù)迭代的過程。我們理想的情況是提供好平臺工具鏈后,企業(yè)能自己持續(xù)迭代,但實際中企業(yè)對新技術(shù)的接受程度有高有低,我們需要提供陪跑或知識傳承服務(wù)。

HiAgent本次大版本的演變可以用 “上下左右” 四個方向來總結(jié):

向右是開發(fā)和運(yùn)營一體化,智能體需要持續(xù)運(yùn)營,就像傳統(tǒng)軟件開發(fā)的 DevOps,我們從單純的智能體開發(fā)增加了運(yùn)營環(huán)節(jié),包括開發(fā)后的評估、上線后的監(jiān)測、對話管理、故障定位排查和優(yōu)化,以及反饋數(shù)據(jù)回流調(diào)優(yōu)。

向上是提供更多行業(yè)樣板間和模板庫,面向客服、營銷、招聘、辦公等常見場景,細(xì)分到教育、醫(yī)療、金融等行業(yè),提供模板庫,讓企業(yè)基于模板快速從 0.8 做到 1,只需做少量修改。

向下是模型和應(yīng)用一體化,智能體效果很大程度取決于模型能力,很多行業(yè)需要對模型做精調(diào),將通用模型通過強(qiáng)化學(xué)習(xí)、蒸餾等方式打造成領(lǐng)域模型,再搭建智能體,所以新版本融入了模型層面的工具鏈,支持后訓(xùn)練、強(qiáng)化學(xué)習(xí)、蒸餾等。

向左是前端用戶使用階段,企業(yè)內(nèi)部可能開發(fā)幾百個智能體,入口零散,所以我們提供了統(tǒng)一的交互入口 ——AI 工作臺,形成完整鏈路,開發(fā)的智能體發(fā)布到同一工作臺,用戶在一個端就能與所有智能體交互,實現(xiàn)多智能體協(xié)同。

問:企業(yè)有了飛書和釘釘之后,協(xié)同辦公工具會不會成為Agent的入口,HiAgent的入口是真么樣的?

答:飛書和釘釘本質(zhì)上是解決人與人協(xié)同的問題,我們的 AI 工作臺以畫布形式呈現(xiàn),支持千人千面,根據(jù)用戶角色和意圖動態(tài)生成不同內(nèi)容卡片,不僅能展示圖表等豐富信息,還能與企業(yè)已有系統(tǒng)打通,將存量系統(tǒng)以 MCP 工具形式發(fā)布到端上,讓智能體調(diào)用。

例如廣州公交集團(tuán),他們配置的數(shù)字員工解決內(nèi)部辦公審核場景,這些數(shù)字員工有工號,甚至有考評,智能體成為數(shù)字化生產(chǎn)力,走向生產(chǎn)崗位,機(jī)協(xié)作從人主導(dǎo)轉(zhuǎn)向智能體主導(dǎo),人作為培訓(xùn)師、生產(chǎn)關(guān)系定義者和管理者。

AI Agent 與現(xiàn)有應(yīng)用的關(guān)系分為兩類:一是增強(qiáng)或重塑現(xiàn)有應(yīng)用,比如在瑞幸 APP 中嵌入智能點單助手提升流程效率,或在飛書中通過智能體生成會議紀(jì)要;二是創(chuàng)造傳統(tǒng)軟件無法解決的新應(yīng)用形態(tài),如科研領(lǐng)域的 DeepResearch 智能體自動完成行業(yè)調(diào)研和報告生成。

從用戶視角看,是否知道使用的是 Agent 并不重要,關(guān)鍵是交互體驗,未來 Agent 形態(tài)不一定是對話框,可能是圖形界面與對話結(jié)合的千人千面畫布,根據(jù)用戶角色動態(tài)展示信息。

問:目前更有動力采用Agent的企業(yè),有沒有一些共性畫像?

答:對于想做 Agent 的企業(yè),他們的畫像大致有幾類:市場競爭越充分的行業(yè)和企業(yè),對 Agent 的擁抱程度越高,因為新技術(shù)是雙刃劍,可能削弱領(lǐng)先者優(yōu)勢,實現(xiàn)知識平權(quán);企業(yè)或行業(yè)要有較好的數(shù)字化基礎(chǔ),因為 AI 基于數(shù)據(jù)和知識,如果企業(yè)沒有線上化數(shù)據(jù),很難保證 AI 效果;此外,在現(xiàn)階段,積極擁抱 Agent 的往往源于企業(yè)一把手,一把手對 AI 浪潮的堅定信念很重要,就像數(shù)字化轉(zhuǎn)型是一把手工程一樣,Agent 落地也需要自上而下推動。

和企業(yè)溝通時,也有一個明顯變化,最早更多從技術(shù)層面科普,解釋大模型路線、預(yù)訓(xùn)練、精調(diào)、提示詞工程等,而現(xiàn)在大模型進(jìn)入普惠化時代,企業(yè)對大模型能力已有足夠了解,技術(shù)也走向標(biāo)準(zhǔn)化,很多企業(yè)在提示詞工程和知識庫建設(shè)上已有實操經(jīng)驗。

所以現(xiàn)在更多圍繞如何與業(yè)務(wù)緊密結(jié)合展開,比如如何通過大模型重塑現(xiàn)有 APP、小程序的用戶體驗,打造新業(yè)務(wù)模式,以及企業(yè)內(nèi)部管理方式如何變化。因為大模型出現(xiàn)后,智能體積累知識后能勝任更多工作,企業(yè)內(nèi)部流程管理方式也會改變,這是現(xiàn)在溝通的重點。

問:那企業(yè)有沒有一些不合理的認(rèn)知或者誤區(qū),需要厘清?

答:一是對大模型過高和過低的預(yù)估,企業(yè)高層可能過分高估 AI 能力,而一線人員使用后發(fā)現(xiàn)知識盲區(qū),比如之前的比大小問題,可能過分低估 AI,需要建立合理認(rèn)知。

二是很多企業(yè)把 AI 項目當(dāng)作傳統(tǒng)軟件項目,交付即結(jié)束,導(dǎo)致交付即過時,因為業(yè)務(wù)場景、數(shù)據(jù)、領(lǐng)域知識在變,智能體需要持續(xù)調(diào)優(yōu),催生出 AI 訓(xùn)練師等新工種。

三是企業(yè)認(rèn)為廠商應(yīng)包攬所有工作,但實際上企業(yè)需要投入精力梳理業(yè)務(wù)場景、現(xiàn)有流程,準(zhǔn)備數(shù)據(jù),尤其是將存在于人腦中的經(jīng)驗和決策過程轉(zhuǎn)化為大模型可用的形式,這是技術(shù)服務(wù)商無法替代的,項目成功的關(guān)鍵在于企業(yè)是否愿意投入人力和時間與服務(wù)商合作。

問:以前很多開發(fā)者做應(yīng)用,更看重流量,Agent會有類似的問題么?

答:這個說得特別對,我們?yōu)槭裁醋鼋y(tǒng)一的端,其實就想抓住大家真正使用Agent的觸手,不光可以直接和智能體交互,還可以和很多工具交互,智能體一定不是孤立存在的。

一個新技術(shù)一定有和老技術(shù)的共存期,企業(yè)內(nèi)部已有的CRM、 OA、各種 API、各種算法。這些工具還是會存在,如何讓智能體更好和已有的一些系統(tǒng)去做打通,我們也希望通過統(tǒng)一的端,能夠完成和所有存量系統(tǒng)的打通,這樣我們就抓住了流量的入口。

問:傳統(tǒng)軟件開發(fā)和Agent開發(fā)有什么區(qū)別,程序員應(yīng)該掌握什么技能?

答:Agent 開發(fā)與傳統(tǒng)軟件開發(fā)的區(qū)別在于:開發(fā)方式從邏輯驅(qū)動(大量 if-else)變?yōu)槟繕?biāo)驅(qū)動(提示詞明確目標(biāo));測試從功能測試變?yōu)槎说蕉诵袨闇y試;監(jiān)控從代碼監(jiān)控變?yōu)閷υ捄退季S鏈管理,需要新的工具鏈。

程序員轉(zhuǎn)型做 Agent 開發(fā),需要掌握提示詞工程,具備產(chǎn)品思維,因為提示詞本質(zhì)類似 PRD,需要前置定義場景。

企業(yè)級 Agent 更傾向于結(jié)合工作流,對確定規(guī)則的場景(如差旅報銷、新員工入職)使用工作流,對不確定場景(如市場調(diào)研、金融分析)嘗試自主任務(wù)規(guī)劃,兩者可結(jié)合,在整體工作流中對確定步驟調(diào)用工具,對不確定步驟讓智能體自主決策。

問:大模型用了一年多的時間收斂,從“百模大戰(zhàn)”到如今的頭部幾家,智能體構(gòu)建平臺會收斂的更快么?

答:當(dāng)前智能體開發(fā)平臺處于百家爭鳴階段,尚未形成統(tǒng)一標(biāo)準(zhǔn),HiAgent的差異化在于開發(fā)運(yùn)營一體化、模型應(yīng)用一體化、研發(fā)使用一體化,性能上支持企業(yè)級的高并發(fā)。

智能體開發(fā)平臺還在發(fā)散階段,未來可能像云原生一樣形成標(biāo)準(zhǔn),如通過類似容器的描述文件定義智能體,實現(xiàn)跨平臺遷移。

不同于容器時代,開發(fā)者對云廠商依賴不強(qiáng),Agent 時代粘性會更強(qiáng):一是 Agent 依賴算力基礎(chǔ)設(shè)施,推理成本和算力性能影響體驗;二是 Agent 有長期記憶和知識庫,數(shù)據(jù)積累形成遷移壁壘;三是模型能力影響智能體效果,用戶對云廠商的模型和算力依賴度更高,不同于 Kubernetes 時代的低粘性。

總結(jié)來看,智能體開發(fā)平臺的核心是圍繞全生命周期管理,提供從開發(fā)、運(yùn)營到應(yīng)用的一體化能力,而 2025 年 Agent 元年的到來,需要技術(shù)、生態(tài)和商業(yè)模式的共同成熟,推動智能體從工具向生產(chǎn)力的真正蛻變。

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多