|
https://mp.weixin.qq.com/s/vHhYIuvjmsMAx_sssUzImg 大家好,我是夙愿學(xué)長,一名利用課余時間探索 AI 的斜桿青年。 如果你關(guān)注 AI 大模型、AI 提示詞、AI 寫作這幾個領(lǐng)域的話,你就知道,Claude3-Opus 模型在寫作任務(wù)上表現(xiàn)得非常出色。 光說你可能感受不出來,我們上一個案例: 下面我使用 KimiChat 內(nèi)置的 小紅書濃人文案 提示詞,分別在 Claude3-Opus 和 KimiChat 中測試寫一段手工類的筆記文案: ![]() 很明顯,Claude3-Opus寫出來的文案非常是真人寫的,而且情緒感十足,反觀右邊 kimichat,文字冷冰冰的,沒有“濃人”的感覺,還一股子“AI味”。 進(jìn)行到這一步的時候,我得到了一個結(jié)論: 如果你發(fā)現(xiàn)用 AI 大模型寫文案怎么調(diào)提示詞,其輸出的內(nèi)容都很爛,大概率不是人的問題,是大模型本身的問題。 也就是說,與其鉆研怎么打磨優(yōu)化提示詞,不如先鉆研出哪個大模型才擅長寫作類任務(wù)。 Claude 不錯,這個結(jié)論我們已經(jīng)知道了,但是由于眾所周知的原因,Claude 在國內(nèi)很難用得上。 而正好我的 AI 陪伴群的群友問到我國內(nèi)哪家大模型比較適合寫文案,于是我今天花了點時間,找到國內(nèi)比較熱門的大模型,挨個去測試了一下,結(jié)果出乎意料。 橫向?qū)Ρ?/h2>首先,有請我們的參賽選手: 通義千問:https://tongyi.aliyun.com/qianwen/ 萬知:https://www./ 躍問 AI:https:///chats/new 智譜清言:https:///main/alltoolsdetail DeepSeek:https://www./ Kimi Chat:https://kimi./ 訊飛星火:https://xinghuo./spark 文心一言:https://yiyan.baidu.com/ 測試方法: 輸入小紅書濃人文案的提示詞---等待大模型回復(fù)---輸入“主題:性價比最高的鼠標(biāo)” 首先,先上兩個直接被 pass的「考生」,文言一言 3.5 和訊飛星火認(rèn)知大模型,我還沒輸入主題,大模型就開始創(chuàng)作內(nèi)容了,不仔細(xì)看規(guī)則。 ![]() ![]() 接下來是其他大模型輸出的結(jié)果,我在圖片的第一行標(biāo)注的大模型的名稱,建議點開放大左右滑動查看。 ![]() ![]() ![]() ![]() ![]() ![]() ![]() 一輪測試下來,我發(fā)現(xiàn)萬知、Kimi Chat、DeepSeek的表現(xiàn)還不錯,把這三個同時打開對比一下: ![]() 從綜合表現(xiàn)來看,我個人對萬知的表現(xiàn)最滿意,標(biāo)題有網(wǎng)感、正文 AI 味相對較少、而且還幫忙寫了筆記標(biāo)簽。 有趣的是,萬知和 DeepSeek 這兩家都是最近新上線的產(chǎn)品, 果然是長江后浪推前浪。 介紹,簡單介紹一下萬知和 DeepSeek 的“來路”: 萬知萬知是一款為中國人身定制的一站式 AI 工作平臺,提供個人特助服務(wù),幫助用戶提升工作效率。AI 技術(shù)在職場生態(tài)中的應(yīng)用越來越受到重視,萬知的推出將為用戶提供更便捷高效的工作體驗。 ?? 萬知是一款為中國人身定制的一站式 AI 工作平臺,提供個人特助服務(wù)。 ?? 萬知提供了三大 AI 秘技: 知識問答、文檔閱讀和 PPT 生成,幫助用戶完成工作任務(wù)。 ?? AI 能夠秒速讀取5000頁文檔,快速生成 PPT,并支持手機(jī)和 PC 端之間的接力修改。 DeepSeekDeepSeek-V2 基于 2 千億 MoE 模型底座,其綜合能力表現(xiàn)十分出色,中文綜合能力(AlignBench)在開源模型中最強(qiáng)與 GPT-4-Turbo,文心 4.0 等閉源模型在評測中處于同一梯隊。 英文綜合能力(MT-Bench)同樣處于第一梯隊,英文綜合能力與最強(qiáng)的開源模型 LLaMA3-70B 處于同一梯隊,超過最強(qiáng) MoE 開源模型 Mixtral8x22B。 以上,enjoy~ |
|
|