|
進入21世紀以來,人工智能依靠機器學(xué)習(xí)和深度學(xué)習(xí)取得了快速進展,但對于機器的訓(xùn)練,需要人類的監(jiān)督以及大量的數(shù)據(jù)來喂養(yǎng),而這些數(shù)據(jù)需要大量的人工去堆砌,對于強人工智能而言,這是不可取的。要實現(xiàn)真正的類人智能,機器還需要掌握大量的常識性知識,以人的思維模式和知識結(jié)構(gòu)來進行語言理解、視覺場景解析和決策分析。 知識圖譜是人工智能的基石 知識圖譜用節(jié)點和關(guān)系所組成的圖譜,為真實世界的各個場景直觀地建模。通過不同知識的關(guān)聯(lián)性形成一個網(wǎng)狀的知識結(jié)構(gòu),對機器來說就是圖譜。 形成知識圖譜的過程本質(zhì)是在建立認知、理解世界、理解應(yīng)用的行業(yè)或者說領(lǐng)域。每個人都有自己的知識面,或者說知識結(jié)構(gòu),本質(zhì)就是不同的知識圖譜。正是因為有獲取和形成知識的能力,人類才可以不斷進步。 知識圖譜對于人工智能的重要價值在于,知識是人工智能的基石。機器可以模仿人類的視覺、聽覺等感知能力,但這種感知能力不是人類的專屬,動物也具備感知能力,甚至某些感知能力比人類更強,比如:狗的嗅覺。 而“認知語言是人區(qū)別于其他動物的能力,同時,知識也使人不斷地進步,不斷地凝練、傳承知識,是推動人不斷進步的重要基礎(chǔ)。” 知識對于人工智能的價值就在于,讓機器具備認知能力。 而構(gòu)建知識圖譜這個過程的本質(zhì),就是讓機器形成認知能力,去理解這個世界。 知識圖譜的技術(shù): 知識圖譜以語義分析技術(shù)為基礎(chǔ),以模型為核心,基于數(shù)據(jù),利用深度神經(jīng)網(wǎng)絡(luò)、NLP框架語義理解等智能處理技術(shù)對輸入的字、詞、篇章進行多層次、多維度的信息分析,提供可遠程調(diào)用的實體抽取、關(guān)系抽取和屬性抽取等算法服務(wù)接口能力。領(lǐng)域知識圖譜構(gòu)建平臺能夠服務(wù)不同行業(yè)和應(yīng)用場景。 構(gòu)建知識圖譜是一個迭代更新的過程,根據(jù)知識獲取的邏輯,每一輪迭代可分為三個階段: 信息抽?。?/strong>從各種類型的數(shù)據(jù)源中提取出實體、屬性以及實體間的相互關(guān)系,在此基礎(chǔ)上形成本體化的知識表達; 知識融合:在獲得新知識之后,需要對其進行整合,以消除矛盾和歧義,比如某些實體可能有多種表達,某個特定稱謂也許對應(yīng)于多個不同的實體等; 知識加工:對于經(jīng)過融合的新知識,需要經(jīng)過質(zhì)量評估之后(部分需要人工參與甄別),才能將合格的部分加入到知識庫中,以確保知識庫的質(zhì)量。 知識圖譜的未來發(fā)展 “純粹的通用型人工智能沒有任何意義,人工智能未來的方向一定是行業(yè)化?!?/strong> 因此行業(yè)知識圖譜的構(gòu)建顯得尤為重要,首先,構(gòu)建行業(yè)知識圖譜系統(tǒng)應(yīng)以海量數(shù)據(jù)匯聚融合、快速感知和認知、強大的分析和推理、自適應(yīng)與自優(yōu)化和行業(yè)智能決策為導(dǎo)向。 通用知識圖譜和行業(yè)知識圖譜構(gòu)建區(qū)別: 通用知識圖譜以互聯(lián)網(wǎng)開放數(shù)據(jù)為基礎(chǔ),以三元組事實型知識為主,較多的面向開放域的Web抽取,對知識抽取的質(zhì)量有一定容忍度,以知識融合提升數(shù)據(jù)質(zhì)量,應(yīng)用領(lǐng)域主要在搜索和問答方面,對推理要求較低。 行業(yè)知識圖譜以領(lǐng)域或企業(yè)內(nèi)部的數(shù)據(jù)為主要來源,通常要求快速擴大規(guī)模,構(gòu)建行業(yè)壁壘,知識結(jié)構(gòu)更加復(fù)雜。知識抽取的質(zhì)量要求很高,較多的依靠從企業(yè)內(nèi)部的結(jié)構(gòu)化、非結(jié)構(gòu)化以及半結(jié)構(gòu)化數(shù)據(jù)進行聯(lián)合抽取,需要依靠人工進行審核校驗,來保證質(zhì)量。通常多來源的領(lǐng)域融合是數(shù)據(jù)擴大規(guī)模的有效手段。行業(yè)知識圖譜的應(yīng)用形式很全面,除搜索問答外,還包括決策分析、業(yè)務(wù)管理等,對推理的要求更高,并有較強的可解釋性要求。 大數(shù)據(jù)的采集分析和計算力已經(jīng)不再是阻礙,難點在于算法背后的知識圖譜構(gòu)建。實際中,企業(yè)數(shù)據(jù)和業(yè)務(wù)變化靈活,因此數(shù)據(jù)源、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)內(nèi)容隨時會發(fā)生變動,對業(yè)務(wù)的理解以及對數(shù)據(jù)的解讀也隨之發(fā)生變化。因此,建立實時敏捷、靈活可擴展、智能自適應(yīng)的動態(tài)知識圖譜尤為重要。 行業(yè)知識圖譜的重要性 由于IT時代的快速發(fā)展,形成了數(shù)據(jù)的聚集,促進了DT時代的來臨,數(shù)據(jù)與算法作為基礎(chǔ)為知識圖譜的構(gòu)建提供了新的可能性,而知識圖譜作為AI的支撐基礎(chǔ),雖然發(fā)展緩慢,卻是人工智能的必經(jīng)之路。其在語義搜索、智能問答、數(shù)據(jù)分析、自然語言處理、視覺理解等方面已展現(xiàn)出越來越大的價值。 基于語音對話系統(tǒng)構(gòu)建的機器人,要想機器人好玩有趣,就需要建立通用知識圖譜,使機器人具有強大的邏輯,了解人與人的關(guān)系,人與物的關(guān)系,人的屬性、物的屬性,理解人類世界的關(guān)系鏈,靈活應(yīng)對用戶的各種聊天需求,使機器具有類人智能。而行業(yè)知識圖譜則幫助用戶解答關(guān)于行業(yè)的任務(wù)型需求,輔助用戶決策,反向幫助人類學(xué)習(xí)。 智通科技為某油田專屬打造的智能問答機器人,基于油氣知識圖譜并使用分詞、實體識別與消歧等自然語言處理技術(shù),將用戶輸入的自然語言中包含的實體與知識圖譜中的實體進行準確鏈接,使機器人可以理解用戶輸入的自然語言中包含的真正意圖,從行業(yè)知識圖譜中抽取精確的內(nèi)容對用戶進行直接問答、統(tǒng)計問答、推理問答。 智通科技智能問答機器人小K 如今,人工智能屬于發(fā)展初期,主要以技術(shù)驅(qū)動行業(yè)發(fā)展,企業(yè)在以行業(yè)+AI為核心的同時,更應(yīng)重視行業(yè)+知識圖譜。未來技術(shù)肯定不是公司的核心競爭力,而多年積累的行業(yè)數(shù)據(jù)才是壁壘,數(shù)據(jù)養(yǎng)育AI,AI反哺數(shù)據(jù)。 智通科技構(gòu)建石化行業(yè)知識圖譜,建立千萬級的知識網(wǎng)絡(luò)關(guān)聯(lián)節(jié)點 智通科技研發(fā)團隊擁有近十年行業(yè)浸潤與技術(shù)積淀,形成了行業(yè)知識圖譜構(gòu)建與應(yīng)用的解決方案,并已在石油石化、軍工、政府等行業(yè)應(yīng)用。智通科技為中國石化建立了集團級知識管理平臺,從百萬數(shù)據(jù)與信息中抽取知識點,基于勘探開發(fā)知識體系的框架,構(gòu)建行業(yè)知識圖譜,形成勘探開發(fā)科研特色知識庫。實現(xiàn)了知識圖譜在復(fù)雜業(yè)務(wù)中實現(xiàn)多源異構(gòu)大數(shù)據(jù)的融合匯聚、分析挖掘,并通過搜索、問答、推薦等智能化知識服務(wù),幫助業(yè)務(wù)人員快速、全面、準確解答關(guān)于行業(yè)的知識需求,有效提升業(yè)務(wù)洞察力、提高整體工作效率與質(zhì)量。 智通科技作為專注于利用人工智能技術(shù)賦能企業(yè)智慧化轉(zhuǎn)型的國家高新技術(shù)企業(yè),利用先進的知識圖譜、自然語言處理、大數(shù)據(jù)、物聯(lián)網(wǎng)等技術(shù)與產(chǎn)品,構(gòu)筑智慧語義、智能制造兩大核心業(yè)務(wù),并打造語義魔方、知識工程平臺、數(shù)字工廠平臺三大旗艦產(chǎn)品,為行業(yè)用戶提供領(lǐng)先的產(chǎn)品和解決方案,是基于新一代AI技術(shù)的智能制造領(lǐng)航者。 未來智通科技將充分利用新一代AI技術(shù),賦能更多的企業(yè)在智能化轉(zhuǎn)型的路上走的更高更遠。 |
|
|
來自: 昵稱16619343 > 《區(qū)塊鏈》