|
原創(chuàng) Mr.K主創(chuàng)團(tuán) 技術(shù)領(lǐng)導(dǎo)力 觀點(diǎn)| Mr.K 主筆| Wendy.L 來源| 技術(shù)領(lǐng)導(dǎo)力(ID:jishulingdaoli) “我們正處在全新起點(diǎn),這是一個(gè)以大模型為核心的人工智能新時(shí)代,大模型改變了人工智能,大模型即將改變世界?!薄?月26日,百度創(chuàng)始人、董事長(zhǎng)兼CEO李彥宏先生在2023中關(guān)村論壇發(fā)表了《大模型改變世界》演講。 李彥宏指出,大模型成功地壓縮了人類對(duì)于整個(gè)世界的認(rèn)知,讓我們看到了實(shí)現(xiàn)通用人工智能的路徑。 越來越多的人相信,第四次產(chǎn)業(yè)革命正在到來,而這次革命正是以人工智能為標(biāo)志的。 人工智能技術(shù)再次成為人類創(chuàng)新的焦點(diǎn),大模型在許多領(lǐng)域的應(yīng)用越來越廣泛,今年以來更是在全球掀起了狂潮。一夜之間,什么元宇宙、區(qū)塊鏈、Web3.0之類的風(fēng)口全都消失了,只有大模型才是唯一的C位。 01 AI大模型到底是什么?大模型(Foundation Model)是指通過大規(guī)模的數(shù)據(jù)、算法和計(jì)算能力訓(xùn)練出的高精度深度學(xué)習(xí)模型,通常具有千萬億次的計(jì)算能力,可以在語音識(shí)別、自然語言處理、圖像識(shí)別等領(lǐng)域,實(shí)現(xiàn)人類甚至超越人類的性能表現(xiàn)。 大模型通常有以下幾大特點(diǎn): 1、巨大的參數(shù)量:大模型通常包含數(shù)十億個(gè)參數(shù),需要大量的數(shù)據(jù)和計(jì)算資源來訓(xùn)練。 2、強(qiáng)大的內(nèi)容生成能力:能夠生成高質(zhì)量的文本和圖像,為自然語言處理和計(jì)算機(jī)視覺等領(lǐng)域的應(yīng)用提供了強(qiáng)大的工具。 3、深厚的語義理解:能夠理解文本和圖像的深層語義信息,為自然語言處理和計(jì)算機(jī)視覺等領(lǐng)域的應(yīng)用提供了深厚的語義理解能力。 4、高效的推理能力:能夠進(jìn)行高效的推理和推斷,為自然語言處理和計(jì)算機(jī)視覺等領(lǐng)域的應(yīng)用提供了高效的推理能力。 5、需要的計(jì)算資源較多:訓(xùn)練和推理需要大量的計(jì)算資源,如GPU和TPU等,需要高性能的計(jì)算集群和云計(jì)算平臺(tái)。 提到大模型,我們不得不再次提起今年爆火的chatGPT來: ![]() 圖:人工智能的四層架構(gòu) 人工智能的四層架構(gòu)分別是:算力層、框架層、模型層和應(yīng)用層,其中: 1、算力層:主要包括芯片、處理器、云計(jì)算和超算等硬件等基礎(chǔ)設(shè)施, AI需要有強(qiáng)大的計(jì)算能力來支持各種算法和應(yīng)用的訓(xùn)練、推斷和分析,算力層就是為人工智能提供強(qiáng)大的計(jì)算和存儲(chǔ)能力的基礎(chǔ)。 2、框架層:人工智能算法的開發(fā)需要使用各種編程語言和框架,框架層是人工智能的基石,例如TensorFlow、PyTorch、MXNet等。這些框架能夠提供高效的計(jì)算圖優(yōu)化、分布式訓(xùn)練等功能,提高人工智能應(yīng)用的開發(fā)和訓(xùn)練效率。 3、模型層:指的是在框架層中訓(xùn)練好的各種人工智能模型,包括深度學(xué)習(xí)模型、傳統(tǒng)機(jī)器學(xué)習(xí)模型、強(qiáng)化學(xué)習(xí)模型等,典型的預(yù)訓(xùn)練大語言模型八廓openAI 的GPT、百度的文心大模型,以及Google的bard大模型等。這些模型是人工智能應(yīng)用的核心,能夠解決各種問題,例如圖像識(shí)別、自然語言處理、推薦系統(tǒng)等。 4、應(yīng)用層:應(yīng)用層處于人工智能的最上層,指的是人工智能技術(shù)在各個(gè)領(lǐng)域的應(yīng)用,例如智能客服、人臉識(shí)別、自動(dòng)駕駛等。這些應(yīng)用能夠幫助企業(yè)和用戶提升效率、改善體驗(yàn)、實(shí)現(xiàn)創(chuàng)新等,同時(shí)應(yīng)用需求也會(huì)反向推動(dòng)模型、框架和算力的升級(jí)和創(chuàng)新。 我們大多數(shù)人所接觸到的AI,往往是處于應(yīng)用層。 但是ChatGPT和文心一言比較特殊,既屬于模型層,也屬于應(yīng)用層。 GPT是基于人工智能領(lǐng)域的大數(shù)據(jù)和機(jī)器學(xué)習(xí)技術(shù),通過大量的訓(xùn)練和優(yōu)化,可以用來生成人類自然語言的大模型;同時(shí),它也是一個(gè)應(yīng)用,可以通過與用戶的交互和對(duì)話,提供有用的信息和幫助,比如回答問題、提供建議、生成文本摘要等。因此,他們處于模型層和應(yīng)用層之間。 所以如果把每天來跟我們進(jìn)行直接對(duì)話交互的chatGPT圖文界面比喻成它的“嘴巴”,那么背后思考我們所提出這些問題的“大腦”,正是大模型這種東西。 02 國內(nèi)外的大模型玩家有哪些?在國外,大模型的研究起步較早,其中的重量級(jí)玩家主要包括谷歌、微軟、亞馬遜、Facebook等大型科技公司。 ![]() 圖:國外知名大模型簡(jiǎn)介 在國內(nèi),隨著人工智能技術(shù)的不斷發(fā)展,大模型的應(yīng)用也越來越廣泛。目前國內(nèi)的大模型玩家主要包括百度、阿里巴巴、騰訊、華為等大型科技公司。其中,百度的文心一言、阿里巴巴的通義系列、騰訊的混元、華為的盤古等是大模型領(lǐng)域的代表作品。這些公司擁有龐大的數(shù)據(jù)和計(jì)算資源,以及豐富的應(yīng)用場(chǎng)景,可以支持大模型的開發(fā)和應(yīng)用。 ![]() 03 AI大模型,真的是風(fēng)口嗎?“今天的初創(chuàng)公司,很多叫做大模型的,包括創(chuàng)業(yè)者,也包括互聯(lián)網(wǎng)大廠我們都不 投。” ——嘉御基金創(chuàng)始合伙人、董事長(zhǎng)衛(wèi)哲表示嘉御基金會(huì)投有數(shù)據(jù)的具體應(yīng)用,但不投大模型 。 今年以來,投資界對(duì)大模型相關(guān)公司出現(xiàn)了很微妙的態(tài)度:既有一些機(jī)構(gòu)回避投資大模型公司,而與此同時(shí),投資大模型的“入場(chǎng)券”(投資門檻)卻悄然從5000萬美元提高到了1億美元。 5月7日,AIGC創(chuàng)建者大會(huì)在上海舉行。線性資本創(chuàng)始合伙人兼CEO王淮發(fā)表了他的看法:“我們個(gè)人感覺這里面創(chuàng)業(yè)公司的機(jī)會(huì)相對(duì)小。”王淮表示,“歷史上創(chuàng)業(yè)公司能夠成功很大的原因是你'為別人所不敢為’,或者做別人認(rèn)為不會(huì)起來、不太看得重的東西,這一類的創(chuàng)業(yè)模式我們稱之為'桃花源式的創(chuàng)業(yè)’。而大模型需要一些必須成功的要素,要有算力,要有錢;在中國,還必須要有政府支持。” 從王淮等人的介紹來看,大模型的應(yīng)用前景的確是非常廣闊,但并不是所有企業(yè)和創(chuàng)業(yè)者都可以在這個(gè)領(lǐng)域取得成功,特別是中小創(chuàng)業(yè)公司。大模型需要大量的數(shù)據(jù)和計(jì)算資源來進(jìn)行訓(xùn)練和優(yōu)化,需要有強(qiáng)大的技術(shù)團(tuán)隊(duì)和豐富的應(yīng)用場(chǎng)景來支持。對(duì)于中小企業(yè)和初創(chuàng)公司來說,進(jìn)入大模型領(lǐng)域會(huì)面臨很多困難和挑戰(zhàn)。 究其原因,從我們前面說過的大模型的特點(diǎn)就可以看出來: 首先,大模型需要消耗大量的計(jì)算資源進(jìn)行訓(xùn)練和優(yōu)化,需要有足夠的資金來支持,作為一個(gè)初創(chuàng)企業(yè),就算融資到了獨(dú)角獸級(jí)別,在大模型領(lǐng)域10億美元這錢也根本不經(jīng)燒。 其次,大模型的開發(fā)和應(yīng)用需要有一個(gè)相對(duì)穩(wěn)定且強(qiáng)大的技術(shù)團(tuán)隊(duì)和管理團(tuán)隊(duì),需要大把大把很貴且很有經(jīng)驗(yàn)的人長(zhǎng)期來進(jìn)行調(diào)參和優(yōu)化。對(duì)于創(chuàng)業(yè)公司,其組織和管理經(jīng)驗(yàn)往往不是很足,很難長(zhǎng)期順利運(yùn)行下去這樣的項(xiàng)目。 最后,由于大模型的應(yīng)用場(chǎng)景非常廣泛,因此其需要有豐富的數(shù)據(jù)和場(chǎng)景來進(jìn)行不斷滋養(yǎng),作為一個(gè)沒什么用戶基礎(chǔ)和數(shù)據(jù)基礎(chǔ)的中小公司,很難訓(xùn)練得出來。 因此,對(duì)于中小企業(yè)和初創(chuàng)公司來說,還是需要謹(jǐn)慎考慮直接進(jìn)入大模型領(lǐng)域。 ![]() 04 創(chuàng)業(yè)的機(jī)會(huì)在哪里?在這個(gè)時(shí)代,創(chuàng)業(yè)公司的機(jī)會(huì)和大模型的發(fā)展非常相似,長(zhǎng)期發(fā)展一定是技術(shù)驅(qū)動(dòng)為主,但在落地的時(shí)候?qū)π枨蟮牟鸾狻⒎治?、梳理和把控,也要綜合考慮自身的實(shí)力和條件,以此來進(jìn)行探索和發(fā)展。 而對(duì)于小的創(chuàng)業(yè)公司來說,可以考慮以下幾方面: 1、基于大模型構(gòu)建行業(yè)模型 正如李彥宏先生所說:“未來所有的應(yīng)用都將基于大模型來開發(fā),每一個(gè)行業(yè)都應(yīng)該有屬于自己的大模型,大模型會(huì)催生AI原生應(yīng)用。未來需要用AI原生思維重構(gòu)所有的產(chǎn)品、服務(wù)和工作流程。” 因此,中小企業(yè)可以針對(duì)不同的行業(yè)的特點(diǎn)和需求,在大模型的基礎(chǔ)上,針對(duì)某個(gè)行業(yè)進(jìn)行定制化的開發(fā)。比如,醫(yī)療、金融、能源等各個(gè)行業(yè)都有自己的痛點(diǎn)和需求,可以利用垂類大模型的能力來解決這些問題。 2、聚焦小場(chǎng)景 雖然大模型在通用自然語言處理任務(wù)上表現(xiàn)出色,但在針對(duì)性場(chǎng)景中,大模型性能可能不如專業(yè)化的小模型。 舉個(gè)簡(jiǎn)單的例子,在語音識(shí)別的時(shí)候,如果有噪聲干擾,或者比較小眾地區(qū)的方言,通用的語音識(shí)別大模型可能就束手無策了,因此,小公司可以聚焦小場(chǎng)景訓(xùn)練小模型,針對(duì)特定的語音識(shí)別任務(wù),如噪聲干擾、不同口音等,以此提高性能,解決用戶的具體痛點(diǎn)。 3、給大模型公司提供服務(wù) “淘金“的活動(dòng)風(fēng)險(xiǎn)高不說,而且還不是誰都能賺到,但是”賣水的生意“卻是幾乎恒定的穩(wěn)賺不賠。未來隨著行業(yè)的井噴,大模型掘金領(lǐng)域的“買水買鍋鏟”等需求會(huì)愈加強(qiáng)烈。因此,創(chuàng)業(yè)公司可以不急著構(gòu)建自己的大模型,轉(zhuǎn)身給大模型公司提供服務(wù)也是一個(gè)不錯(cuò)的選擇,比如以下幾個(gè)方向: 數(shù)據(jù)標(biāo)注:數(shù)據(jù)標(biāo)注是機(jī)器學(xué)習(xí)中重要的環(huán)節(jié),創(chuàng)業(yè)公司可以提供數(shù)據(jù)標(biāo)注服務(wù),幫助大模型公司訓(xùn)練更好的模型。 環(huán)境部署:創(chuàng)業(yè)公司可以提供模型部署服務(wù),幫助大模型公司將模型部署到生產(chǎn)環(huán)境中,使其能夠更好地為用戶提供服務(wù)。 監(jiān)控和分析:所有大模型訓(xùn)練出來之后,都是需要不斷更新和優(yōu)化的,因此創(chuàng)業(yè)公司可以提供監(jiān)控和分析服務(wù),幫助大模型公司監(jiān)測(cè)模型的性能和用戶行為,幫助大模型公司優(yōu)化已經(jīng)訓(xùn)練好的模型,提高模型的精度和效率。 安全和隱私:未來隨著AI應(yīng)用的泛化,人的信息安全和隱私問題也必會(huì)愈來愈受到重視,因此創(chuàng)業(yè)公司可以提供安全和隱私服務(wù),幫助大模型公司保護(hù)用戶的數(shù)據(jù)和隱私,以便更好地遵守法律法規(guī)和保障用戶安全。 號(hào)主簡(jiǎn)介 號(hào)主介紹:Mr.K,黃哲鏗,國內(nèi)知名IT管理專家,「頓悟山丘」咨詢 創(chuàng)始人,科技媒體「技術(shù)領(lǐng)導(dǎo)力」創(chuàng)辦人。暢銷書《技術(shù)人修煉之道》《技術(shù)管理之巔》作者,曾擔(dān)任壹藥網(wǎng) 技術(shù)VP、1號(hào)店技術(shù)總監(jiān)、海爾農(nóng)業(yè)電商CTO。分享個(gè)體成長(zhǎng)、團(tuán)隊(duì)管理、企業(yè)數(shù)字化轉(zhuǎn)型、科技評(píng)論。 |
|
|