|
文 / 道哥 來源 / 智百道 在阿里上線千問APP一天之后,11月18日,螞蟻集團發(fā)布全模態(tài)通用AI助手靈光。 連續(xù)兩天發(fā)布新產(chǎn)品,讓大家應接不暇,不過在《智百道》看來,這并非內(nèi)部賽馬,而是基于不同產(chǎn)品差異化優(yōu)勢的生態(tài)卡位。
千問搭載的是自家的Qwen模型,而靈光底層模型是整合螞蟻自研百靈模型+多家第三方模型,定位也不一樣。 如果說千問是生活入口,旨在深度整合外賣點餐、旅行規(guī)劃等高頻場景,成為AI時代的超級APP。那么靈光扎根于支付寶服務生態(tài),構(gòu)建一個超越傳統(tǒng)搜索與問答的“生產(chǎn)力入口”。據(jù)官方介紹,靈光能在移動端實現(xiàn)“自然語言30秒生成小應用”,首批上線三大功能“靈光對話”、“靈光閃應用”、“靈光開眼”。 那么這些功能實用起來究竟如何?《智百道》特意進行了多個維度的測評。 01 靈光閃應用:手搓APP不在話下
寫段代碼做一個小應用,很多Chatbot都能做,但體驗往往很割裂,你得有臺電腦,還得懂怎么把代碼變成網(wǎng)頁。但在靈光,這一切在手機上就能搞定,它真正把生產(chǎn)力裝進了APP里。 比如,《智百道》要求靈光制作一個計算器,不到半分鐘,對話框里直接跳出來一個可以直接按的計算器,包括加減乘除,直接可以進行簡單的計算,完全不需要我去復制粘貼代碼。 如果你想做個 BMI 身體指數(shù)計算器,體驗更是絲滑,手指直接滑動調(diào)節(jié)身高體重,結(jié)果立馬就出來了,還能告訴你,你的BMI屬于哪個區(qū)間,十分實用。 不僅是工具,摸魚小游戲也是信手拈來。 比如,數(shù)星星、貪吃蛇、掃雷都能做。特別是掃雷,它甚至細分了初、中、高三個等級,點開直接就能玩,完全就是一個成熟的小程序。 最讓我驚喜的功能是“一鍵存儲”。 以前用 AI 寫的東西,劃過去就找不到了。但在靈光,點擊右上角的閃電圖標,就能把這些 AI 生成的小工具存進“我的閃應用”,下次想用,隨時調(diào)取。 當然,也有博主測評了靈光可以制作支付寶應用,《智百道》也特意給它出了個難題,做一個模擬支付寶App要能演示轉(zhuǎn)賬的那種。 可能是因為邏輯復雜,這次它思考了一分鐘,但成品確實不錯,界面像模像樣,而且每個按鈕真的都能點、有反應?!吨前俚馈吩囍D(zhuǎn)賬,也成功了,當然了,這并不是真正的錢,但是交互效果真的不錯,這在目前手機端的AI產(chǎn)品中,確實不多見?;蛟S我們每個人只要精通指令,都能成為一個出色的前端設計師。 02 靈光開眼:可交互的內(nèi)容創(chuàng)作工具
如果說代碼生成展現(xiàn)了靈光的“腦力”,那么靈光特色的“拍圖識物”功能則徹底打通了物理世界與數(shù)字世界的隔閡,讓彼此之間的連接充滿趣味性。 在實測中,我們打開攝像頭對準畫面,靈光瞬間就給出了識別結(jié)果及詳細的文字介紹。 比如,《智百道》在咖啡館,讓靈光識別咖啡杯,它能清楚地識別出這是皮爺咖啡和拿鐵上的心形拉花。 這是在你方便看的時候,如果不方便? 如果你不方便閱讀長文字,完全可以開啟語音問答模式。你只管用鏡頭“看”,用嘴巴“問”,靈光就能通過語音實時解惑,徹底解放了雙手和雙眼。在《智百道》看來,這種體驗在戶外或移動場景下尤為實用。 為了測試識別的精準度與知識深度,《智百道》特意找來了一株并不常見的植物。 靈光不僅在準確叫出了它的學名“龍血樹”,還展現(xiàn)出了它的百科全書體質(zhì)。 對于我這個植物小白來說,認出名字只是第一步,靈光似乎洞察到了我的好奇心,在識別成功后,界面立刻浮現(xiàn)出多個引導性追問:“龍血樹適合哪些環(huán)境生長?”“龍血樹具有哪些藥用價值?”。 這種引導式交互,直接將一次簡單的識圖,變成了一場植物學知識交互。 但靈光顯然不止是做一本“百科”,畢竟官方標榜的能力是多模態(tài),它還能在問答的基礎上去創(chuàng)作。 看著這株龍血樹,《智百道》突發(fā)奇想,能不能讓靜止的植物活過來?我們切換至創(chuàng)作模式,開啟了一場整蠱實驗。
輸入Prompt “變成毛絨玩具,動起來”,原本以為會得到一張靜態(tài)圖,沒想到一分鐘后,靈光直接生成了一段視頻:畫面中原本硬朗的龍血樹葉片變成了毛茸茸的質(zhì)感,這個植物額花盆“長”了腳,地“走”了起來,風格十分二次元。 除了視頻生成,靈光在圖片編輯上的連續(xù)性體驗更讓我們驚喜。 我們繼續(xù)對龍血樹“下手”,輸入prompt“變成水彩畫風格,同時長出幾顆榴蓮”。不到一分鐘,一張畫風清新的水彩畫便呈現(xiàn)在眼前,同時地面上按照我們的要求掛滿了榴蓮。 此時,如果想修改畫面,大多數(shù)AI工具通常需要用戶保存圖片、重新上傳、再寫指令。但靈光打破了這一繁瑣流程,支持多輪對話來修圖。 《智百道》直接在當前對話框追加Prompt,“再加幾顆蘋果”。 靈光基于上一張圖的修改,迅速在保留水彩風格和榴蓮元素的基礎上,自然地融入了綠蘋果。 這種即說即改的絲滑體驗,讓創(chuàng)作不再是指令堆砌,而是更具趣味性。 03 靈光對話:拒絕純文字,攻略更全面
很多人都試過用AI寫旅行計劃,但不知道你有沒有這種感覺,計劃看著挺滿,真要用的時候還得自己二次搜索,繼續(xù)做攻略。畢竟光看文字,你根本不知道這幾個景點順不順路,還是得去查地圖。 比如,我們試著問了DeepSeek和靈光同一個問題,制作一個為期四天的海口旅游計劃。 DeepSeek很嚴謹,經(jīng)過認真的思考后,列出了一二三四點,排版很盡力,但純文字的形式終究有些枯燥。 相比較而靈光給出的答案,則更為精美。除了詳細的文字介紹,它貼心地配上了景點實拍圖,比如??隍T樓老街的煙火氣、云洞圖書館的落日,到底實景如何,直接呈現(xiàn)在你眼前,真正做到了有圖有真相。 但真正的大招在最后。 靈光在攻略底部生成了一張動態(tài)地圖。 注意,這可不是一張看不太清的截圖,而是一個能放大、能移動的實時地圖組件。你可以非常直觀地看到這四天都在海口的哪個區(qū)域活動,今天的路線繞不繞?景點之間相對位置是什么?一眼就能看明白。這種所見即所得的空間感,是傳統(tǒng)Chatbot很難給到的。 在《智百道》看來,螞蟻集團的Chatbot首秀驚喜滿滿,靈光讓AI的價值實現(xiàn)了從信息提供到生產(chǎn)力提供的本質(zhì)轉(zhuǎn)變。從更深層次看,靈光從問答案到造工具,改寫了AI,也改寫普通人的生產(chǎn)力,代表著AI技術普惠化的重要方向這種以用戶需求為核心、以解決實際問題為導向的產(chǎn)品理念,或許正是未來AI入口競爭的關鍵所在。 *題圖由AI生成 |
|
|