【原】智能體革命：未來智能體可能不用“提示詞”來工作？

小張學(xué)AI 2025-04-03 發(fā)布于山東

展開全文

· 大家好，我是 同學(xué)小張，日常分享AI知識(shí)和實(shí)戰(zhàn)案例
· 歡迎 點(diǎn)贊 + 關(guān)注 ??，持續(xù)學(xué)習(xí)，持續(xù)干貨輸出。
· +v: jasper_8017 一起交流??，一起進(jìn)步??，更有專業(yè)資料領(lǐng)??！
微信私信免費(fèi)領(lǐng)取更多 AI、C++等相關(guān)資料，持續(xù)收集更新中！包括但不限于：

在AI技術(shù)持續(xù)突破的今天，Alexander Doria的前沿研究揭示了一個(gè)顛覆性趨勢(shì)：真正的智能體將擺脫對(duì)提示詞的依賴，通過模型本體的進(jìn)化實(shí)現(xiàn)認(rèn)知躍遷。這種范式轉(zhuǎn)換正在重塑人工智能的發(fā)展軌跡。

1. 模型即產(chǎn)品

當(dāng)行業(yè)還在爭(zhēng)論智能體、推理模型與多模態(tài)技術(shù)孰為主導(dǎo)時(shí)，DeepSeek、OpenAI和Anthropic的最新實(shí)踐給出了明確答案——模型本身即是產(chǎn)品。這種轉(zhuǎn)變?cè)从谌齻€(gè)關(guān)鍵驅(qū)動(dòng)力：

· 能力突破瓶頸：

GPT-4.5的發(fā)布昭示著傳統(tǒng)擴(kuò)展路徑的失效，萬(wàn)億參數(shù)級(jí)模型的算力需求已突破經(jīng)濟(jì)可行性邊界

· 定向訓(xùn)練奇效：

強(qiáng)化學(xué)習(xí)與推理能力的融合催生特殊能力涌現(xiàn)，如Claude Sonnet 3.7在未專門訓(xùn)練情況下展現(xiàn)的游戲理解能力

· 成本革命加速：

DeepSeek的優(yōu)化成果顯示，頂尖模型的推理成本已降至可支撐全球日均萬(wàn)億次調(diào)用

這種趨勢(shì)正在顛覆投資市場(chǎng)的預(yù)設(shè)邏輯。當(dāng)模型供應(yīng)商開始直接提供終端產(chǎn)品（如OpenAI的深度研究系統(tǒng)），傳統(tǒng)API經(jīng)濟(jì)模式面臨瓦解，應(yīng)用層企業(yè)被迫在自主訓(xùn)練與淘汰出局間抉擇。

2. 智能體重構(gòu)：從流程編排到認(rèn)知進(jìn)化

當(dāng)前主流智能體方案（如Manus AI）暴露的根本性缺陷，印證了Richard Sutton的"苦澀教訓(xùn)"——依賴人工預(yù)設(shè)的工作流終將遭遇能力天花板。這些系統(tǒng)普遍存在：

· 規(guī)劃能力缺失：

多步驟任務(wù)中易陷入邏輯死循環(huán)

· 記憶機(jī)制脆弱：

超過10分鐘的任務(wù)連續(xù)性難以維持

· 誤差累積效應(yīng)：

單步錯(cuò)誤引發(fā)系統(tǒng)性崩潰

真正的突破來自模型本體的重構(gòu)。

OpenAI深度研究系統(tǒng)展現(xiàn)的三大特征，定義了下一代智能體的標(biāo)準(zhǔn)范式：

· 自主決策閉環(huán)：

內(nèi)化網(wǎng)頁(yè)瀏覽、信息合成等核心能力，無(wú)需外部流程干預(yù)

· 動(dòng)態(tài)策略調(diào)整：

實(shí)時(shí)優(yōu)化搜索路徑，主動(dòng)放棄低效方案

· 推理痕跡可視化：

完整記錄決策過程，實(shí)現(xiàn)可解釋AI

這種進(jìn)化本質(zhì)上是復(fù)雜性的戰(zhàn)略轉(zhuǎn)移——通過訓(xùn)練階段預(yù)置海量可能性，換取部署時(shí)的極致簡(jiǎn)化。正如Anthropic定義的智能體標(biāo)準(zhǔn)：必須實(shí)現(xiàn)工具使用策略的動(dòng)態(tài)決策權(quán)。

3. 訓(xùn)練民主化：破解智能體進(jìn)化的密鑰

實(shí)現(xiàn)真正智能體的技術(shù)路徑已逐漸清晰：

· 環(huán)境仿真系統(tǒng)：

構(gòu)建包含2億+網(wǎng)頁(yè)的模擬搜索空間，通過數(shù)據(jù)映射實(shí)現(xiàn)真實(shí)環(huán)境復(fù)現(xiàn)

· 漸進(jìn)式訓(xùn)練法：

采用SFT-RL混合策略，先建立基礎(chǔ)認(rèn)知框架，再通過強(qiáng)化學(xué)習(xí)優(yōu)化決策

· 驗(yàn)證器革命：

利用小規(guī)模模型構(gòu)建分布式驗(yàn)證網(wǎng)絡(luò)，突破傳統(tǒng)獎(jiǎng)勵(lì)函數(shù)的局限性

值得關(guān)注的是，這種訓(xùn)練模式正在打破算力壟斷。

開源社區(qū)已實(shí)現(xiàn)單卡A100完成GRPO算法訓(xùn)練，預(yù)示著智能體技術(shù)的大眾化拐點(diǎn)臨近。

中國(guó)企業(yè)的前瞻布局（如DeepSeek的基礎(chǔ)設(shè)施化戰(zhàn)略）更凸顯這種趨勢(shì)的不可逆性。

4. 生態(tài)重構(gòu)：價(jià)值鏈的重新洗牌

當(dāng)智能體突破預(yù)設(shè)指令的桎梏，將引發(fā)三重產(chǎn)業(yè)變革：

· 能力維度擴(kuò)展：

從簡(jiǎn)單問答升級(jí)為系統(tǒng)工程，例如網(wǎng)絡(luò)配置自動(dòng)生成、金融標(biāo)準(zhǔn)智能轉(zhuǎn)換

· 交互范式革新：

基于深度推理的預(yù)測(cè)式交互，替代當(dāng)前的反應(yīng)式交互

· 價(jià)值分配重構(gòu)：

模型訓(xùn)練方將捕獲90%+產(chǎn)業(yè)價(jià)值，應(yīng)用層面臨生存空間擠壓

這種變革對(duì)資本市場(chǎng)提出嚴(yán)峻挑戰(zhàn)。當(dāng)前AI投資集中在應(yīng)用層的"虛假繁榮"，與強(qiáng)化學(xué)習(xí)等底層技術(shù)的價(jià)值低估形成鮮明反差。Prime Intellect等訓(xùn)練技術(shù)公司的融資困境，暴露出現(xiàn)行投資邏輯與技術(shù)演進(jìn)方向的嚴(yán)重錯(cuò)位。

5. 未來展望：2025智能體覺醒元年

盡管技術(shù)巨頭占據(jù)先發(fā)優(yōu)勢(shì)，但訓(xùn)練民主化進(jìn)程正在打開新的可能性窗口。

開源驗(yàn)證模型、GRPO訓(xùn)練樣本等資源的開放，將催生去中心化的智能體生態(tài)。正如Tim Berners-Lee預(yù)言的"認(rèn)知自動(dòng)化"時(shí)代，真正的智能體將成為人類思維的延伸，在保持決策透明度的同時(shí)，完成意識(shí)映射級(jí)的任務(wù)理解。

這場(chǎng)革命最終驗(yàn)證了一個(gè)本質(zhì)規(guī)律：人工智能的終極形態(tài)，必將是掙脫人類思維預(yù)設(shè)的自主認(rèn)知體。

當(dāng)模型學(xué)會(huì)像生物進(jìn)化般自我完善時(shí)，我們迎來的不僅是技術(shù)突破，更是文明認(rèn)知范式的根本轉(zhuǎn)變。