电竞比分网-中国电竞赛事及体育赛事平台

分享

264頁最強 Agents 發(fā)展與挑戰(zhàn)綜述,微軟&谷歌&MetaGPT聯(lián)合出品!

 mrjiangkai 2025-05-22 發(fā)布于上海
MetaGPT&微軟&港科大&斯坦福&谷歌等20個機構(gòu)聯(lián)合發(fā)表長達264頁的最強基礎(chǔ) Agents 發(fā)展與挑戰(zhàn)從受大腦啟發(fā)的智能到進化、協(xié)作和安全的系統(tǒng), 提供了一個全面的概述,將智能 Agents 置于一個模塊化、受大腦啟發(fā)的架構(gòu)中,整合了認知科學、神經(jīng)科學以及計算研究的原則。圖片
按主要腦區(qū)劃分的關(guān)鍵人類大腦功能的示意圖,標注了其在 AI (大型語言模型LLMs、AI Agent)研究中的當前探索水平。突出了現(xiàn)有成就、差距以及推動 AI 能朝著更全面、受大腦啟發(fā)的能力發(fā)展的潛在機會。
圖片
主張從人腦中汲取靈感,系統(tǒng)地分析和設(shè)計 AI Agents 框架:生物系統(tǒng)通過將專業(yè)化的組件(用于感知、推理、行動等)緊密整合來實現(xiàn)通用智能——這種方法可以作為加強當前基于LLM的 Agents 的藍圖。
描述智能Agents循環(huán)和Agents社會的總體框架概覽
圖片
更多信息:《動手設(shè)計AI Agents:CrewAI版》、《高級RAG之36技》、新技術(shù)實戰(zhàn):中文Lazy-GraphRAG/Manus+MCP/GRPO+Agent、大模型日報/月報、最新技術(shù)熱點追蹤解讀(GPT4-o/數(shù)字人/MCP/Gemini 2.5 Pro)
將探索分為四個相互關(guān)聯(lián)的部分:
  • 首先,深入研究智能Agents的模塊化基礎(chǔ),系統(tǒng)地將其認知、感知操作模塊映射到類似人類大腦的功能,并闡明記憶、世界建模、獎勵處理以及類似情感系統(tǒng)等核心組件。
  • 其次,討論自我增強和適應(yīng)性進化機制,探討如何通過自動化優(yōu)化范式(包括新興的AutoML和LLM驅(qū)動的優(yōu)化策略)自主完善其能力、適應(yīng)動態(tài)環(huán)境并實現(xiàn)持續(xù)學習。
  • 第三,研究協(xié)作和進化multi-Agent系統(tǒng),調(diào)查從Agent互動、合作以及社會結(jié)構(gòu)中涌現(xiàn)的集體智能,并強調(diào)其與人類社會動態(tài)的相似之處。
  • 最后,著重討論構(gòu)建安全、可靠且有益的AI系統(tǒng)
一、智能Agents的模塊化基礎(chǔ)
  • 認知(Cognition)首先探討學習,研究它在心理狀態(tài)內(nèi)部發(fā)生的空間以及它所服務(wù)的具體目標。隨后,研究推理,分析結(jié)構(gòu)化和非結(jié)構(gòu)化的方法,最后專門探討規(guī)劃能力作為一種特殊的推理行為。
圖片

  • 記憶(Memory):首先簡要概述人類記憶,重點關(guān)注編碼、鞏固和檢索等關(guān)鍵階段。然后,將探討設(shè)計人工智能代理記憶系統(tǒng)的多樣化方法,從傳統(tǒng)的符號表示到前沿的基于神經(jīng)網(wǎng)絡(luò)的方法。最后,將考慮如何從神經(jīng)科學和認知心理學中汲取原則以指導未來研究。
圖片
  • 世界模型(World Model):探討了人類認知研究中的“心理模型”與人工智能中的AI世界模型之間的關(guān)系,并將其歸類為四種范式:隱式范式、顯式范式、基于模擬器的范式以及一類其他新興方法(例如,指令驅(qū)動范式)。
圖片
圖片
  • 獎勵(Reward):獎勵幫助代理區(qū)分有益和有害的行動,塑造其學習過程并影響其決策制定。
圖片
圖片
  • 感知(Perception):感知是人類和智能Agent獲取信息、解釋周圍環(huán)境并最終做出明智決策的基礎(chǔ)途徑
圖片
  • 行動系統(tǒng)(Action System)基礎(chǔ)模型為Agent奠定了基礎(chǔ),而行動系統(tǒng)決定了它們實現(xiàn)復(fù)雜目標的最終潛力
圖片
圖片
二、智能Agent系統(tǒng)的自我進化
所有手工設(shè)計的Agent人工智能系統(tǒng)最終都將被可學習和自我進化的系統(tǒng)所取代,這最終可能會將Agent人工智能的開發(fā)和改進置于一個自主、自給自足的循環(huán)中。
關(guān)鍵概念的示意圖:包括優(yōu)化空間、優(yōu)化器和優(yōu)化目標。優(yōu)化器在優(yōu)化空間內(nèi)迭代地細化組件,以增強代理系統(tǒng),直到達到滿意的結(jié)果,從而在LLM代理系統(tǒng)中實現(xiàn)自我改進。
圖片
為了實現(xiàn)自動化人類努力的目標,許多研究提出了利用LLM作為驅(qū)動力,以實現(xiàn)代理系統(tǒng)的自我進化。特別是,LLM為傳統(tǒng)的優(yōu)化方法(如基于梯度和基于強化學習的方法)提供了一種高效的替代方案。它們將優(yōu)化空間從數(shù)值擴展到更多樣化的領(lǐng)域,自然語言作為通用橋梁。
LLM能夠優(yōu)化復(fù)雜的、異構(gòu)的參數(shù),如指令和工具實現(xiàn),并且可以在包括開源和閉源模型在內(nèi)的各種LLM上運行。這種方法的一個顯著例子是AFLOW,它自動化了整個代理系統(tǒng)工作流程的生成和優(yōu)化。該系統(tǒng)采用蒙特卡洛樹搜索來利用LLM的全面能力。在這個框架中,傳統(tǒng)手工制作的代理系統(tǒng)被算法生成的系統(tǒng)所取代,標志著一種范式的轉(zhuǎn)變。

圖片
  • 最近在代理系統(tǒng)研究中探索的各種優(yōu)化空間,包括提示、工具和工作流程。
圖片
  • 優(yōu)化算法,討論了傳統(tǒng)的優(yōu)化范式和元優(yōu)化,其中優(yōu)化過程也會影響底層的優(yōu)化算法本身。
  • 自我進化場景,將其分為兩種類型:在線優(yōu)化和離線優(yōu)化。
圖片
  • 大型語言模型(LLM)代理自我改進技術(shù)的應(yīng)用,特別是在人工智能用于科學(AI-for-science)領(lǐng)域的知識發(fā)現(xiàn)。
圖片
三、協(xié)作和進化multi-agent系統(tǒng)
系統(tǒng)地調(diào)研了基于LLM的multi-agent系統(tǒng)的協(xié)作機制和進化能力。
  • 不同的系統(tǒng)目標如何塑造代理的角色、行為模式和協(xié)作策略。
  • 分析了各種通信結(jié)構(gòu),包括促進有效代理間和人機通信的交互協(xié)議。
  • 探討了協(xié)作決策制定方法,以及代理如何利用其獨特的專業(yè)知識和視角,
  • 討論了集體智能和進化機制以及進化過程,重點介了適應(yīng)性學習方法、持續(xù)的知識共享以及共同提升MAS性能的迭代改進機制。
圖片
圖片
https:///pdf/2504.01990Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Collaborative, and Safe Systemshttps://github.com/FoundationAgents/awesome-foundation-agents

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多