电竞比分网-中国电竞赛事及体育赛事平台

分享

LLMs之GLM-4:GLM-4的簡(jiǎn)介、安裝和使用方法、案例應(yīng)用之詳細(xì)攻略

 處女座的程序猿 2024-01-17 發(fā)布于上海

LLMs之GLM-4:GLM-4的簡(jiǎn)介、安裝和使用方法、案例應(yīng)用之詳細(xì)攻略

導(dǎo)讀:2024年01月16日,智譜AI在「智譜AI技術(shù)開放日(Zhipu DevDay)」推出新一代基座大模型GLM-4。GLM-4 的主要亮點(diǎn)和能力如下:
>> 性能與GPT-4相近:多模態(tài)、長(zhǎng)文本能力得到提升。在多個(gè)評(píng)測(cè)集上,GLM-4性能已接近或超過GPT-4。
>> 強(qiáng)大的多模態(tài)能力:文生圖和多模態(tài)理解能力得到增強(qiáng),效果超過開源SD模型,逼近DALLE-3。
>> 全新推出的All Tools能力:GLM-4能自主理解和執(zhí)行復(fù)雜任務(wù),調(diào)用瀏覽器、代碼解釋器等完成復(fù)雜工作。
>> 個(gè)性化智能體功能:用戶可以通過智譜官網(wǎng)輕松創(chuàng)建屬于自己的GLM智能體,實(shí)現(xiàn)大模型開發(fā)定制。
開心一笑,送給每一位AI研究學(xué)者:“OpenAI摸著石頭過河,我們摸著OpenAI過河?!?^~^


GLM-4的簡(jiǎn)介

2024年01月16日,智譜AI在「智譜AI技術(shù)開放日(Zhipu DevDay)」推出新一代基座大模型GLM-4。智譜AI發(fā)布 All Tools、GLMs、MaaS API、大模型科研基金、大模型開源基金以及「Z計(jì)劃」創(chuàng)業(yè)基金等內(nèi)容。
新一代基座大模型GLM-4,整體性能相比GLM3全面提升60%,逼近GPT-4;支持更長(zhǎng)上下文;更強(qiáng)的多模態(tài);支持更快推理速度,更多并發(fā),大大降低推理成本;同時(shí)GLM-4增強(qiáng)了智能體能力

1、模型性能

基礎(chǔ)能力(英文)

GLM-4 在 MMLU、GSM8K、MATH、BBH、HellaSwag、HumanEval等數(shù)據(jù)集上,分別達(dá)到GPT-4 94%、95%、91%、99%、90%、100%的水平。

圖片

指令跟隨能力:達(dá)到GPT-4的90%左右

GLM-4在IFEval的prompt級(jí)別上中、英分別達(dá)到GPT-4的88%、85%的水平,在Instruction級(jí)別上中、英分別達(dá)到GPT-4的90%、89%的水平。

圖片

對(duì)齊能力:整體超過GPT-4

GLM-4在中文對(duì)齊能力上整體超過GPT-4。

圖片

長(zhǎng)文本能力:超過 Claude 2.1

我們?cè)贚ongBench(128K)測(cè)試集上對(duì)多個(gè)模型進(jìn)行評(píng)測(cè),GLM-4性能超過 Claude 2.1;在「大海撈針」(128K)實(shí)驗(yàn)中,GLM-4的測(cè)試結(jié)果為 128K以內(nèi)全綠,做到100%精準(zhǔn)召回。

圖片

多模態(tài)-文生圖:是DALLE3的90%多

CogView3在文生圖多個(gè)評(píng)測(cè)指標(biāo)上,相比DALLE3 約在 91.4%?~99.3%的水平之間。

圖片

2、ALL Tools:根據(jù)用戶意圖,自動(dòng)理解、規(guī)劃復(fù)雜指令

GLM-4 實(shí)現(xiàn)自主根據(jù)用戶意圖,自動(dòng)理解、規(guī)劃復(fù)雜指令,自由調(diào)用網(wǎng)頁(yè)瀏覽器、Code Interpreter代碼解釋器和多模態(tài)文生圖大模型,以完成復(fù)雜任務(wù)。簡(jiǎn)單來(lái)講,即只需一個(gè)指令,GLM-4會(huì)自動(dòng)分析指令,結(jié)合上下文選擇決定調(diào)用合適的工具。

All Tools -文生圖

GLM-4 能夠結(jié)合上下文進(jìn)行AI繪畫創(chuàng)作(CogView3),如下圖所示,大模型能夠遵循人的指令來(lái)不斷修改生成圖片的結(jié)果:

圖片

All Tools - 代碼解釋器:接近或同等GPT-4 All Tools的水平

GLM-4能夠通過自動(dòng)調(diào)用python解釋器,進(jìn)行復(fù)雜計(jì)算(例如復(fù)雜方程、微積分等),在GSM8K、MATH、Math23K等多個(gè)評(píng)測(cè)集上都取得了接近或同等GPT-4 All Tools的水平。

圖片

通過?動(dòng)調(diào)? python 解釋器,進(jìn)?復(fù)雜計(jì)算(復(fù)雜?程、微積分等)???????

同樣GLM-4 也可以完成文件處理、數(shù)據(jù)分析、圖表繪制等復(fù)雜任務(wù),支持處理Excel、PDF、PPT等格式文件。

All Tools -?網(wǎng)頁(yè)瀏覽:是GPT-4 All Tools 的116%

GLM-4 能夠自行規(guī)劃?rùn)z索任務(wù)、自行選擇信息源、自行與信息源交互,在準(zhǔn)確率上能夠達(dá)到 78.08,是GPT-4 All Tools 的116%。

圖片

All Tools - Function Call:與 GPT-4 Turbo 相當(dāng)

GLM-4 能夠根據(jù)用戶提供的Function描述,自動(dòng)選擇所需 Function并生成參數(shù),以及根據(jù) Function 的返回值生成回復(fù);同時(shí)也支持一次輸入進(jìn)行多次 Function 調(diào)用,支持包含中文及特殊符號(hào)的 Function 名字。這一方面GLM-4 All Tools 與 GPT-4 Turbo 相當(dāng)。

圖片

All Tools - 多工具自動(dòng)調(diào)用

除了以上單項(xiàng)工具自動(dòng)調(diào)用外,GLM-4 同樣能夠?qū)崿F(xiàn)多工具自動(dòng)調(diào)用,例如結(jié)合?網(wǎng)頁(yè)瀏覽、CogView3、代碼解釋器等的調(diào)用方式。

圖片

圖片

3、We Are? More?Open

We are more open。我們一直在路上, 我們期待與所有研究者和開發(fā)者共同探索大模型的未來(lái),為社會(huì)創(chuàng)造價(jià)值。

從ChatGLM一代二代三代以來(lái),我們幾乎開源了所有內(nèi)核模型,包括千億級(jí)基座GLM-130B、搜索增強(qiáng)模型WebGLM、圖形理解模型VisualGLM、代碼模型CodeGeeX1、2,文生圖模型CogView1、2,圖形增強(qiáng)理解模型CogVLM還有可視化認(rèn)知Agent模型CogAgent。我們希望這些模型能夠幫助大家深入認(rèn)知大模型技術(shù),而不是簡(jiǎn)單調(diào)用,幫助大家一起探索大模型技術(shù)的未來(lái)。

4、技術(shù)開放日—大會(huì)演講PPT部分內(nèi)容補(bǔ)充

公司歷程

???????

算法創(chuàng)新→模型之戰(zhàn)→產(chǎn)業(yè)化落地→AGI

性能對(duì)比:GLM對(duì)比GPT

開源對(duì)比:GLM對(duì)比LLaMA

GLM-4的安裝和使用方法

1、安裝

等待開源中……

2、GLMs?& MaaS API

網(wǎng)頁(yè)版體驗(yàn)地址:https:///main/detail

GLM-4的全線能力提升使得我們有機(jī)會(huì)探索真正意義上的GLMs。用戶可以下載(更新)智譜清言 APP,進(jìn)行體驗(yàn),快速創(chuàng)建和分享自己的「智能體」。

圖片

同樣,MaaS 平臺(tái)也將全網(wǎng)開放 GLM-4、GLM-4V、CogView3 等模型 API,并邀請(qǐng)內(nèi)測(cè) GLM-4 Assistant API。

3、使用方法

T1、利用API接口調(diào)用GLM-4

GLM-4的API接口文檔https://open./dev/api#glm-4

cogview-3的???????API接口文檔https://open./dev/api#cogview

import zhipuai

zhipuai.api_key = "your api key"
response = zhipuai.model_api.sse_invoke(
    model="glm-4",
    prompt= [],
    temperature= 0.95,
    top_p= 0.7,
    incremental=True
)

for event in response.events():
    if event.event == "add":
        print(event.data, end="")
    elif event.event == "error" or event.event == "interrupted":
        print(event.data, end="")
    elif event.event == "finish":
        print(event.data)
        print(event.meta, end="")
    else:
        print(event.data, end="")

GLM-4的案例應(yīng)用

1、使用現(xiàn)成工具測(cè)試效果

(1)、調(diào)用官方網(wǎng)頁(yè)工具

效果分析:信息定位到了,但存在舊版信息內(nèi)容,故大模型總結(jié)存在偏差。

更多內(nèi)容探索中……

2、動(dòng)手創(chuàng)建

(1)、科研論文小助手:自定義一個(gè)Agent幫你翻譯論文

(2)、笑伴君側(cè):自定義一個(gè)Agent給我?guī)?lái)歡笑

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多