【原】LLMs之GLM-4：GLM-4的簡(jiǎn)介、安裝和使用方法、案例應(yīng)用之詳細(xì)攻略

處女座的程序猿 2024-01-17 發(fā)布于上海

展開全文

LLMs之GLM-4：GLM-4的簡(jiǎn)介、安裝和使用方法、案例應(yīng)用之詳細(xì)攻略

導(dǎo)讀：2024年01月16日，智譜AI在「智譜AI技術(shù)開放日(Zhipu DevDay)」推出新一代基座大模型GLM-4。GLM-4 的主要亮點(diǎn)和能力如下:
>> 性能與GPT-4相近：多模態(tài)、長(zhǎng)文本能力得到提升。在多個(gè)評(píng)測(cè)集上，GLM-4性能已接近或超過GPT-4。
>> 強(qiáng)大的多模態(tài)能力：文生圖和多模態(tài)理解能力得到增強(qiáng)，效果超過開源SD模型，逼近DALLE-3。
>> 全新推出的All Tools能力：GLM-4能自主理解和執(zhí)行復(fù)雜任務(wù)，調(diào)用瀏覽器、代碼解釋器等完成復(fù)雜工作。
>> 個(gè)性化智能體功能：用戶可以通過智譜官網(wǎng)輕松創(chuàng)建屬于自己的GLM智能體，實(shí)現(xiàn)大模型開發(fā)定制。
開心一笑，送給每一位AI研究學(xué)者：“OpenAI摸著石頭過河，我們摸著OpenAI過河?！?^~^

GLM-4的簡(jiǎn)介

2024年01月16日，智譜AI在「智譜AI技術(shù)開放日(Zhipu DevDay)」推出新一代基座大模型GLM-4。智譜AI發(fā)布 All Tools、GLMs、MaaS API、大模型科研基金、大模型開源基金以及「Z計(jì)劃」創(chuàng)業(yè)基金等內(nèi)容。
新一代基座大模型GLM-4，整體性能相比GLM3全面提升60%，逼近GPT-4；支持更長(zhǎng)上下文；更強(qiáng)的多模態(tài)；支持更快推理速度，更多并發(fā)，大大降低推理成本；同時(shí)GLM-4增強(qiáng)了智能體能力。

1、模型性能

基礎(chǔ)能力（英文）

GLM-4 在 MMLU、GSM8K、MATH、BBH、HellaSwag、HumanEval等數(shù)據(jù)集上，分別達(dá)到GPT-4 94%、95%、91%、99%、90%、100%的水平。

指令跟隨能力：達(dá)到GPT-4的90%左右

GLM-4在IFEval的prompt級(jí)別上中、英分別達(dá)到GPT-4的88%、85%的水平，在Instruction級(jí)別上中、英分別達(dá)到GPT-4的90%、89%的水平。

對(duì)齊能力：整體超過GPT-4

GLM-4在中文對(duì)齊能力上整體超過GPT-4。

長(zhǎng)文本能力：超過 Claude 2.1

我們?cè)贚ongBench（128K）測(cè)試集上對(duì)多個(gè)模型進(jìn)行評(píng)測(cè)，GLM-4性能超過 Claude 2.1；在「大海撈針」（128K）實(shí)驗(yàn)中，GLM-4的測(cè)試結(jié)果為 128K以內(nèi)全綠，做到100%精準(zhǔn)召回。

多模態(tài)-文生圖：是DALLE3的90%多

CogView3在文生圖多個(gè)評(píng)測(cè)指標(biāo)上，相比DALLE3 約在 91.4%?~99.3%的水平之間。

2、ALL Tools：根據(jù)用戶意圖，自動(dòng)理解、規(guī)劃復(fù)雜指令

GLM-4 實(shí)現(xiàn)自主根據(jù)用戶意圖，自動(dòng)理解、規(guī)劃復(fù)雜指令，自由調(diào)用網(wǎng)頁(yè)瀏覽器、Code Interpreter代碼解釋器和多模態(tài)文生圖大模型，以完成復(fù)雜任務(wù)。簡(jiǎn)單來(lái)講，即只需一個(gè)指令，GLM-4會(huì)自動(dòng)分析指令，結(jié)合上下文選擇決定調(diào)用合適的工具。

All Tools -文生圖

GLM-4 能夠結(jié)合上下文進(jìn)行AI繪畫創(chuàng)作（CogView3），如下圖所示，大模型能夠遵循人的指令來(lái)不斷修改生成圖片的結(jié)果：

All Tools - 代碼解釋器：接近或同等GPT-4 All Tools的水平

GLM-4能夠通過自動(dòng)調(diào)用python解釋器，進(jìn)行復(fù)雜計(jì)算（例如復(fù)雜方程、微積分等），在GSM8K、MATH、Math23K等多個(gè)評(píng)測(cè)集上都取得了接近或同等GPT-4 All Tools的水平。

通過?動(dòng)調(diào)? python 解釋器，進(jìn)?復(fù)雜計(jì)算（復(fù)雜?程、微積分等）???????

同樣GLM-4 也可以完成文件處理、數(shù)據(jù)分析、圖表繪制等復(fù)雜任務(wù)，支持處理Excel、PDF、PPT等格式文件。

All Tools -?網(wǎng)頁(yè)瀏覽：是GPT-4 All Tools 的116%

GLM-4 能夠自行規(guī)劃?rùn)z索任務(wù)、自行選擇信息源、自行與信息源交互，在準(zhǔn)確率上能夠達(dá)到 78.08，是GPT-4 All Tools 的116%。

All Tools - Function Call：與 GPT-4 Turbo 相當(dāng)

GLM-4 能夠根據(jù)用戶提供的Function描述，自動(dòng)選擇所需 Function并生成參數(shù)，以及根據(jù) Function 的返回值生成回復(fù)；同時(shí)也支持一次輸入進(jìn)行多次 Function 調(diào)用，支持包含中文及特殊符號(hào)的 Function 名字。這一方面GLM-4 All Tools 與 GPT-4 Turbo 相當(dāng)。

All Tools - 多工具自動(dòng)調(diào)用

除了以上單項(xiàng)工具自動(dòng)調(diào)用外，GLM-4 同樣能夠?qū)崿F(xiàn)多工具自動(dòng)調(diào)用，例如結(jié)合?網(wǎng)頁(yè)瀏覽、CogView3、代碼解釋器等的調(diào)用方式。

3、We Are? More?Open

We are more open。我們一直在路上，我們期待與所有研究者和開發(fā)者共同探索大模型的未來(lái)，為社會(huì)創(chuàng)造價(jià)值。

從ChatGLM一代二代三代以來(lái)，我們幾乎開源了所有內(nèi)核模型，包括千億級(jí)基座GLM-130B、搜索增強(qiáng)模型WebGLM、圖形理解模型VisualGLM、代碼模型CodeGeeX1、2，文生圖模型CogView1、2，圖形增強(qiáng)理解模型CogVLM還有可視化認(rèn)知Agent模型CogAgent。我們希望這些模型能夠幫助大家深入認(rèn)知大模型技術(shù)，而不是簡(jiǎn)單調(diào)用，幫助大家一起探索大模型技術(shù)的未來(lái)。

4、技術(shù)開放日—大會(huì)演講PPT部分內(nèi)容補(bǔ)充

公司歷程

???????

算法創(chuàng)新→模型之戰(zhàn)→產(chǎn)業(yè)化落地→AGI

性能對(duì)比：GLM對(duì)比GPT

開源對(duì)比：GLM對(duì)比LLaMA

GLM-4的安裝和使用方法

1、安裝

等待開源中……

2、GLMs?& MaaS API

網(wǎng)頁(yè)版體驗(yàn)地址：https:///main/detail

GLM-4的全線能力提升使得我們有機(jī)會(huì)探索真正意義上的GLMs。用戶可以下載（更新）智譜清言 APP，進(jìn)行體驗(yàn)，快速創(chuàng)建和分享自己的「智能體」。

同樣，MaaS 平臺(tái)也將全網(wǎng)開放 GLM-4、GLM-4V、CogView3 等模型 API，并邀請(qǐng)內(nèi)測(cè) GLM-4 Assistant API。

3、使用方法

T1、利用API接口調(diào)用GLM-4

GLM-4的API接口文檔：https://open./dev/api#glm-4

cogview-3的???????API接口文檔：https://open./dev/api#cogview

import zhipuai

zhipuai.api_key = "your api key"
response = zhipuai.model_api.sse_invoke(
    model="glm-4",
    prompt= [],
    temperature= 0.95,
    top_p= 0.7,
    incremental=True
)

for event in response.events():
    if event.event == "add":
        print(event.data, end="")
    elif event.event == "error" or event.event == "interrupted":
        print(event.data, end="")
    elif event.event == "finish":
        print(event.data)
        print(event.meta, end="")
    else:
        print(event.data, end="")