|
LLMs之GLM-4:GLM-4的簡(jiǎn)介、安裝和使用方法、案例應(yīng)用之詳細(xì)攻略
GLM-4的簡(jiǎn)介2024年01月16日,智譜AI在「智譜AI技術(shù)開放日(Zhipu DevDay)」推出新一代基座大模型GLM-4。智譜AI發(fā)布 All Tools、GLMs、MaaS API、大模型科研基金、大模型開源基金以及「Z計(jì)劃」創(chuàng)業(yè)基金等內(nèi)容。 1、模型性能基礎(chǔ)能力(英文)GLM-4 在 MMLU、GSM8K、MATH、BBH、HellaSwag、HumanEval等數(shù)據(jù)集上,分別達(dá)到GPT-4 94%、95%、91%、99%、90%、100%的水平。
指令跟隨能力:達(dá)到GPT-4的90%左右GLM-4在IFEval的prompt級(jí)別上中、英分別達(dá)到GPT-4的88%、85%的水平,在Instruction級(jí)別上中、英分別達(dá)到GPT-4的90%、89%的水平。
對(duì)齊能力:整體超過GPT-4GLM-4在中文對(duì)齊能力上整體超過GPT-4。
長(zhǎng)文本能力:超過 Claude 2.1我們?cè)贚ongBench(128K)測(cè)試集上對(duì)多個(gè)模型進(jìn)行評(píng)測(cè),GLM-4性能超過 Claude 2.1;在「大海撈針」(128K)實(shí)驗(yàn)中,GLM-4的測(cè)試結(jié)果為 128K以內(nèi)全綠,做到100%精準(zhǔn)召回。
多模態(tài)-文生圖:是DALLE3的90%多CogView3在文生圖多個(gè)評(píng)測(cè)指標(biāo)上,相比DALLE3 約在 91.4%?~99.3%的水平之間。
2、ALL Tools:根據(jù)用戶意圖,自動(dòng)理解、規(guī)劃復(fù)雜指令GLM-4 實(shí)現(xiàn)自主根據(jù)用戶意圖,自動(dòng)理解、規(guī)劃復(fù)雜指令,自由調(diào)用網(wǎng)頁(yè)瀏覽器、Code Interpreter代碼解釋器和多模態(tài)文生圖大模型,以完成復(fù)雜任務(wù)。簡(jiǎn)單來(lái)講,即只需一個(gè)指令,GLM-4會(huì)自動(dòng)分析指令,結(jié)合上下文選擇決定調(diào)用合適的工具。 All Tools -文生圖GLM-4 能夠結(jié)合上下文進(jìn)行AI繪畫創(chuàng)作(CogView3),如下圖所示,大模型能夠遵循人的指令來(lái)不斷修改生成圖片的結(jié)果:
All Tools - 代碼解釋器:接近或同等GPT-4 All Tools的水平GLM-4能夠通過自動(dòng)調(diào)用python解釋器,進(jìn)行復(fù)雜計(jì)算(例如復(fù)雜方程、微積分等),在GSM8K、MATH、Math23K等多個(gè)評(píng)測(cè)集上都取得了接近或同等GPT-4 All Tools的水平。
通過?動(dòng)調(diào)? python 解釋器,進(jìn)?復(fù)雜計(jì)算(復(fù)雜?程、微積分等)??????? 同樣GLM-4 也可以完成文件處理、數(shù)據(jù)分析、圖表繪制等復(fù)雜任務(wù),支持處理Excel、PDF、PPT等格式文件。 All Tools -?網(wǎng)頁(yè)瀏覽:是GPT-4 All Tools 的116%GLM-4 能夠自行規(guī)劃?rùn)z索任務(wù)、自行選擇信息源、自行與信息源交互,在準(zhǔn)確率上能夠達(dá)到 78.08,是GPT-4 All Tools 的116%。
All Tools - Function Call:與 GPT-4 Turbo 相當(dāng)GLM-4 能夠根據(jù)用戶提供的Function描述,自動(dòng)選擇所需 Function并生成參數(shù),以及根據(jù) Function 的返回值生成回復(fù);同時(shí)也支持一次輸入進(jìn)行多次 Function 調(diào)用,支持包含中文及特殊符號(hào)的 Function 名字。這一方面GLM-4 All Tools 與 GPT-4 Turbo 相當(dāng)。
All Tools - 多工具自動(dòng)調(diào)用除了以上單項(xiàng)工具自動(dòng)調(diào)用外,GLM-4 同樣能夠?qū)崿F(xiàn)多工具自動(dòng)調(diào)用,例如結(jié)合?網(wǎng)頁(yè)瀏覽、CogView3、代碼解釋器等的調(diào)用方式。
3、We Are? More?OpenWe are more open。我們一直在路上, 我們期待與所有研究者和開發(fā)者共同探索大模型的未來(lái),為社會(huì)創(chuàng)造價(jià)值。 從ChatGLM一代二代三代以來(lái),我們幾乎開源了所有內(nèi)核模型,包括千億級(jí)基座GLM-130B、搜索增強(qiáng)模型WebGLM、圖形理解模型VisualGLM、代碼模型CodeGeeX1、2,文生圖模型CogView1、2,圖形增強(qiáng)理解模型CogVLM還有可視化認(rèn)知Agent模型CogAgent。我們希望這些模型能夠幫助大家深入認(rèn)知大模型技術(shù),而不是簡(jiǎn)單調(diào)用,幫助大家一起探索大模型技術(shù)的未來(lái)。 4、技術(shù)開放日—大會(huì)演講PPT部分內(nèi)容補(bǔ)充公司歷程
??????? 算法創(chuàng)新→模型之戰(zhàn)→產(chǎn)業(yè)化落地→AGI
性能對(duì)比:GLM對(duì)比GPT
開源對(duì)比:GLM對(duì)比LLaMA
GLM-4的安裝和使用方法1、安裝等待開源中…… 2、GLMs?& MaaS API網(wǎng)頁(yè)版體驗(yàn)地址:https:///main/detail GLM-4的全線能力提升使得我們有機(jī)會(huì)探索真正意義上的GLMs。用戶可以下載(更新)智譜清言 APP,進(jìn)行體驗(yàn),快速創(chuàng)建和分享自己的「智能體」。
同樣,MaaS 平臺(tái)也將全網(wǎng)開放 GLM-4、GLM-4V、CogView3 等模型 API,并邀請(qǐng)內(nèi)測(cè) GLM-4 Assistant API。 3、使用方法T1、利用API接口調(diào)用GLM-4GLM-4的API接口文檔:https://open./dev/api#glm-4 cogview-3的???????API接口文檔:https://open./dev/api#cogview
GLM-4的案例應(yīng)用1、使用現(xiàn)成工具測(cè)試效果(1)、調(diào)用官方網(wǎng)頁(yè)工具效果分析:信息定位到了,但存在舊版信息內(nèi)容,故大模型總結(jié)存在偏差。
更多內(nèi)容探索中…… 2、動(dòng)手創(chuàng)建(1)、科研論文小助手:自定義一個(gè)Agent幫你翻譯論文
(2)、笑伴君側(cè):自定義一個(gè)Agent給我?guī)?lái)歡笑
|
|
|