|
作者 | 微軟亞洲研究院社會(huì)計(jì)算組 編輯 | Natalie AI 前線導(dǎo)讀:本文將從深度學(xué)習(xí)的應(yīng)用、知識(shí)圖譜的應(yīng)用、強(qiáng)化學(xué)習(xí)的應(yīng)用、用戶畫像、可解釋推薦等幾個(gè)方面切入,看看未來推薦系統(tǒng)最重要的幾大研究方向。 “猜你喜歡”、“購買過此商品的用戶還購買過……”對(duì)于離不開社交平臺(tái)、電商、新聞閱讀、生活服務(wù)的現(xiàn)代互聯(lián)網(wǎng)用戶來說,個(gè)性化推薦已經(jīng)不是什么新鮮事兒。 隨著信息技術(shù)和互聯(lián)網(wǎng)行業(yè)的發(fā)展,信息過載成了人們處理信息的挑戰(zhàn)。對(duì)于用戶而言,如何在以指數(shù)增長(zhǎng)的資源中快速、準(zhǔn)確地定位到自己需要的內(nèi)容是一個(gè)非常重要且極具挑戰(zhàn)的事情。對(duì)于商家而言,如何把恰當(dāng)?shù)奈锲芳皶r(shí)呈現(xiàn)給用戶,從而促進(jìn)交易量和經(jīng)濟(jì)增長(zhǎng),也是一件頗具難度的事情。推薦系統(tǒng)的誕生極大地緩解了這個(gè)困難。 推薦系統(tǒng)是一種信息過濾系統(tǒng),能根據(jù)用戶的檔案或者歷史行為記錄,學(xué)習(xí)出用戶的興趣愛好,預(yù)測(cè)出用戶對(duì)給定物品的評(píng)分或偏好。它改變了商家與用戶的溝通方式,加強(qiáng)了和用戶之間的交互性。 據(jù)報(bào)道,推薦系統(tǒng)給亞馬遜帶來了 35% 的銷售收入,給 Netflix 帶來了高達(dá) 75% 的消費(fèi),并且 Youtube 主頁上 60% 的瀏覽來自推薦服務(wù)。 因此,如何搭建有效的推薦系統(tǒng)意義深遠(yuǎn)。我們將從深度學(xué)習(xí)的應(yīng)用、知識(shí)圖譜的應(yīng)用、強(qiáng)化學(xué)習(xí)的應(yīng)用、用戶畫像、可解釋推薦等幾個(gè)方面,一起看看推薦系統(tǒng)的未來。 研究熱點(diǎn) 1:推薦系統(tǒng)與深度學(xué)習(xí) 近幾年深度學(xué)習(xí)的技術(shù)應(yīng)用在語音識(shí)別、計(jì)算機(jī)視覺和自然語言理解等領(lǐng)域,取得了巨大的成功。如何將其應(yīng)用到推薦系統(tǒng)是當(dāng)前的研究熱點(diǎn)。深度推薦系統(tǒng)現(xiàn)階段的應(yīng)用主要體現(xiàn)在如下三個(gè)層面: 提升表征學(xué)習(xí)能力。深度神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)在于其強(qiáng)大的表征學(xué)習(xí)能力。因此,一種最直接的應(yīng)用是,利用深度學(xué)習(xí)技術(shù)從復(fù)雜的內(nèi)容數(shù)據(jù)中學(xué)習(xí)出有效的隱因子特征表示,從而后續(xù)可以很方便地為推薦系統(tǒng)所用。 深度協(xié)同過濾。經(jīng)典的矩陣分解模型可以被描述為一種非常簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)。我們可以通過拓展其中的結(jié)構(gòu),引入更多的非線性單元來加強(qiáng)推薦模型的功能。例如,在 WWW 2017 論文《Neural collaborative filtering》中,作者提出了加強(qiáng)版的矩陣分解模型。一方面,它彌補(bǔ)了兩個(gè)隱向量的樸素點(diǎn)積操作不能區(qū)分各維度之間重要性差別的弱點(diǎn);另一方面,它額外引入了一個(gè)多層感知機(jī)模塊,用來引入更多的非線性操作。除此之外,自動(dòng)編碼機(jī)、卷積神經(jīng)網(wǎng)絡(luò)、記憶網(wǎng)絡(luò)、注意力網(wǎng)絡(luò)等深度學(xué)習(xí)相關(guān)技術(shù)也分別被應(yīng)用在改進(jìn)傳統(tǒng)的協(xié)同過濾模型中,取得了不錯(cuò)的效果。 特征間的深度交互。企業(yè)級(jí)的推薦系統(tǒng)為了盡量提高模型的準(zhǔn)確性,往往會(huì)使用豐富的甚至異構(gòu)的內(nèi)容數(shù)據(jù)。這些特征從不同的維度展現(xiàn)了不同的信息,而且特征間的組合通常是非常有意義的。傳統(tǒng)的交叉特征是由工程師手動(dòng)設(shè)計(jì)的,這有很大的局限性,成本很高,并且不能拓展到未曾出現(xiàn)過的交叉模式中。因此學(xué)者們開始研究用神經(jīng)網(wǎng)絡(luò)去自動(dòng)學(xué)習(xí)高階的特征交互模式,彌補(bǔ)人工特征工程帶來的種種局限性。這個(gè)層面相關(guān)的模型包括 Wide&Deep、PNN、DeepFM、DCN、以及我們近期提出的 xDeepFM 模型 (《xDeepFM: Combining Explicit and Implicit Feature Interactions for Recommender Systems》,KDD 2018) 等。 深度學(xué)習(xí)技術(shù)在推薦系統(tǒng)中的應(yīng)用前景很廣闊。下面簡(jiǎn)要介紹幾個(gè)未來可能的研究方向: 效率與可拓展性 對(duì)于工業(yè)界推薦系統(tǒng)而言,不僅需要考慮模型的準(zhǔn)確度,運(yùn)行效率和可維護(hù)性也是非常重要的方面。效率指的是當(dāng)用戶發(fā)來一個(gè)請(qǐng)求時(shí),推薦系統(tǒng)能夠以接近實(shí)時(shí)的速度返回結(jié)果,而不需讓用戶等待;可維護(hù)性指系統(tǒng)的部署簡(jiǎn)便,能夠支持定期更新,或者增量式更新。眾所周知,復(fù)雜神經(jīng)網(wǎng)絡(luò)的計(jì)算量是龐大的,如何將它們更高效的應(yīng)用在超大規(guī)模的推薦平臺(tái)上,是亟需解決的技術(shù)難點(diǎn)。 多樣化數(shù)據(jù)融合 現(xiàn)實(shí)平臺(tái)中,用戶或者物品的數(shù)據(jù)往往是復(fù)雜多樣的。物品的內(nèi)容可以包括文本、圖像、類別等數(shù)據(jù);用戶的行為數(shù)據(jù)可以來自多個(gè)領(lǐng)域,例如社交網(wǎng)絡(luò)、搜索引擎、新聞閱讀應(yīng)用等;用戶的行為反饋也可以是豐富多樣的,例如電商網(wǎng)站中,用戶的行為可能有搜索、瀏覽、點(diǎn)擊、收藏、購買等。不僅如此,在這些不同的維度中,不同用戶或物品的數(shù)據(jù)分布也千差萬別;用戶在不同的行為反饋上的數(shù)據(jù)量也不同,點(diǎn)擊行為的數(shù)據(jù)量往往遠(yuǎn)大于購買行為的數(shù)據(jù)量。因此,單一、同構(gòu)的模型是不能有效地處理這些多樣化的數(shù)據(jù)的。如何深度融合這些復(fù)雜數(shù)據(jù)是一個(gè)技術(shù)難點(diǎn)。 捕捉用戶長(zhǎng)短期偏好 用戶的偏好大致可以分為長(zhǎng)期和短期兩類。長(zhǎng)期偏好往往指用戶的興趣所在,例如她是五月天的歌迷,那么未來很長(zhǎng)時(shí)間她都會(huì)對(duì)五月天的歌曲、演唱會(huì)門票感興趣;短期偏好指的是用戶在當(dāng)前環(huán)境下的即時(shí)興趣,例如最近一周用戶比較喜歡聽抖音上的熱門歌曲,那么推薦系統(tǒng)也應(yīng)該捕捉到用戶的這個(gè)興趣,或者用戶在未來一個(gè)月有搬家的打算,那么推薦系統(tǒng)可以適當(dāng)?shù)赝扑鸵恍┌峒夜镜膹V告。目前一些流行的做法是,將循環(huán)神經(jīng)網(wǎng)絡(luò)與深度協(xié)同過濾技術(shù)結(jié)合,從而達(dá)到兼顧長(zhǎng)短期記憶的功能。如何結(jié)合情境因素的影響,將用戶的長(zhǎng)期偏好與短期需求更緊密、有效地結(jié)合起來,也是一個(gè)研究熱點(diǎn)。 研究熱點(diǎn) 2:推薦系統(tǒng)與知識(shí)圖譜 在多數(shù)推薦場(chǎng)景中,物品可能包含豐富的知識(shí)信息,而刻畫這些知識(shí)的網(wǎng)絡(luò)結(jié)構(gòu)即被稱為知識(shí)圖譜。物品端的知識(shí)圖譜極大地?cái)U(kuò)展了物品的信息,強(qiáng)化了物品之間的聯(lián)系,為推薦提供了豐富的參考價(jià)值,更能為推薦結(jié)果帶來額外的多樣性和可解釋性 (圖 1)。 圖 1:利用知識(shí)圖譜發(fā)掘新聞間的潛在相關(guān)性 和社交網(wǎng)絡(luò)相比,知識(shí)圖譜是一種異構(gòu)網(wǎng)絡(luò),因此針對(duì)知識(shí)圖譜的推薦算法設(shè)計(jì)要更復(fù)雜和精巧。近年來,網(wǎng)絡(luò)特征學(xué)習(xí) (network representation learning) 逐漸成為機(jī)器學(xué)習(xí)中的一個(gè)熱門的研究方向。引入網(wǎng)絡(luò)特征學(xué)習(xí)的方法處理推薦系統(tǒng)中知識(shí)圖譜的相關(guān)信息,有助于增強(qiáng)推薦系統(tǒng)的學(xué)習(xí)能力,提高精確度和用戶滿意度。 將知識(shí)圖譜引入推薦系統(tǒng),主要有如兩種不同的處理方式: 第一,基于特征的知識(shí)圖譜輔助推薦,核心是知識(shí)圖譜特征學(xué)習(xí)的引入。一般而言,知識(shí)圖譜是一個(gè)由三元組<頭節(jié)點(diǎn),關(guān)系,尾節(jié)點(diǎn)> 組成的異構(gòu)網(wǎng)絡(luò)。由于知識(shí)圖譜天然的高維性和異構(gòu)性,首先使用知識(shí)圖譜特征學(xué)習(xí)對(duì)其進(jìn)行處理,從而得到實(shí)體和關(guān)系的低維稠密向量表示。這些低維的向量表示可以較為自然地與推薦系統(tǒng)進(jìn)行結(jié)合和交互。 在這種處理框架下,推薦系統(tǒng)和知識(shí)圖譜特征學(xué)習(xí)事實(shí)上就成為兩個(gè)相關(guān)的任務(wù)。而依據(jù)其訓(xùn)練次序不同,又有兩種結(jié)合形式:
第二,基于結(jié)構(gòu)的推薦模型,則更加直接地使用知識(shí)圖譜的結(jié)構(gòu)特征。具體來說,對(duì)于知識(shí)圖譜中的每一個(gè)實(shí)體,我們都進(jìn)行寬度優(yōu)先搜索來獲取其在知識(shí)圖譜中的多跳關(guān)聯(lián)實(shí)體從中得到推薦結(jié)果。根據(jù)利用關(guān)聯(lián)實(shí)體的技術(shù)的不同,可分向外傳播法和向內(nèi)聚合法兩種方法:
結(jié)合知識(shí)圖譜推薦系統(tǒng)的機(jī)遇與挑戰(zhàn) 將推薦算法與知識(shí)圖譜的圖計(jì)算方法相結(jié)合已逐漸成為學(xué)術(shù)熱點(diǎn),前景廣闊。然而現(xiàn)有方法仍有一定局限,有充分的研究空間。首先,現(xiàn)有模型都屬于統(tǒng)計(jì)學(xué)習(xí)模型,即挖掘網(wǎng)絡(luò)中的統(tǒng)計(jì)學(xué)信息并以此進(jìn)行推斷。一個(gè)困難但更有研究前景的方向是在網(wǎng)絡(luò)中進(jìn)行推理,將圖推理與推薦系統(tǒng)相結(jié)合。其二,如何設(shè)計(jì)出性能優(yōu)秀且運(yùn)行效率高的算法,也是潛在的研究方向。現(xiàn)有模型并不涉及計(jì)算引擎層面、系統(tǒng)層面甚至硬件層面的考量,如何將上層算法和底層架構(gòu)進(jìn)行聯(lián)合設(shè)計(jì)和優(yōu)化,是實(shí)際應(yīng)用中一個(gè)亟待研究的問題。最后,現(xiàn)有的模型網(wǎng)絡(luò)結(jié)構(gòu)都是靜態(tài)的,在真實(shí)場(chǎng)景中,知識(shí)圖譜具有一定的時(shí)效。如何刻畫這種時(shí)間演變的網(wǎng)絡(luò),并在推薦時(shí)充分考慮時(shí)序信息,也值得我們未來研究。 研究熱點(diǎn) 3:推薦系統(tǒng)與強(qiáng)化學(xué)習(xí) 通過融合深度學(xué)習(xí)與知識(shí)圖譜技術(shù),推薦系統(tǒng)的性能取得了大幅的提升。然而,多數(shù)的推薦系統(tǒng)仍是以一步到位的方式建立的。它們有著類似的搭建方式,即在充分獲取用戶歷史數(shù)據(jù)的前提下,設(shè)計(jì)并訓(xùn)練特定的監(jiān)督模型,從而得到用戶對(duì)于不同物品的喜好程度。這些訓(xùn)練好的模型在部署上線后可以為特定用戶識(shí)別出最具吸引力的物品,為其做出個(gè)性化推薦。在此,人們往往假設(shè)用戶數(shù)據(jù)已充分獲取,且其行為會(huì)在較長(zhǎng)時(shí)間之內(nèi)保持穩(wěn)定,使得上述過程中所建立的推薦模型得以應(yīng)付實(shí)際中的需求。然而對(duì)于諸多現(xiàn)實(shí)場(chǎng)景,例如電子商務(wù)或者在線新聞平臺(tái),用戶與推薦系統(tǒng)之間往往會(huì)發(fā)生持續(xù)密切的交互行為。在這一過程中,用戶的反饋將彌補(bǔ)可能的數(shù)據(jù)缺失,同時(shí)有力地揭示其當(dāng)前的行為特征,從而為系統(tǒng)進(jìn)行更加精準(zhǔn)的個(gè)性化推薦提供重要的依據(jù)。 強(qiáng)化學(xué)習(xí)為解決這個(gè)問題提供了有力支持。依照用戶的行為特征,我們將涉及到的推薦場(chǎng)景劃分為靜態(tài)與動(dòng)態(tài),并分別對(duì)其進(jìn)行討論。 靜態(tài)場(chǎng)景下的強(qiáng)化推薦 在靜態(tài)場(chǎng)景之下,用戶的行為特征在與系統(tǒng)的交互過程中保持穩(wěn)定不變。對(duì)于這一場(chǎng)景,一類有代表性的工作是基于上下文多臂老虎機(jī)(contextual multi-armed bandit)的推薦系統(tǒng),它的發(fā)展為克服推薦場(chǎng)景中的冷啟動(dòng)問題提供了行之有效的解決方案。在許多現(xiàn)實(shí)應(yīng)用中,用戶的歷史行為往往服從特定的長(zhǎng)尾分布,即大多數(shù)用戶僅僅產(chǎn)生規(guī)模有限的歷史數(shù)據(jù),而極少的用戶則會(huì)生成較為充足的歷史數(shù)據(jù)。這一現(xiàn)象所帶來的數(shù)據(jù)稀疏問題使得傳統(tǒng)模型在很多時(shí)候難以得到令人滿意的實(shí)際效果。 為此,一個(gè)直接的應(yīng)對(duì)方法是對(duì)用戶行為進(jìn)行主動(dòng)式的探索,即通過對(duì)用戶發(fā)起大量嘗試性的推薦,以充分的獲得其行為數(shù)據(jù),從而保障推薦系統(tǒng)的可用性。然而不幸的是,這一簡(jiǎn)單的做法勢(shì)必引發(fā)極大的探索開銷,使得它在現(xiàn)實(shí)中并不具備可行性。為使主動(dòng)式探索具備可行的效用開銷,人們嘗試借助多臂老虎機(jī)問題所帶來的啟發(fā)。多臂老虎機(jī)問題旨在于“探索 - 利用”間做出最優(yōu)的權(quán)衡,為此諸多經(jīng)典算法,被相繼提出。盡管不同的算法有著不同的實(shí)施機(jī)制,它們的設(shè)計(jì)都本著一個(gè)共同的原則。 具體說來,系統(tǒng)在做出推薦的時(shí)候會(huì)綜合考慮物品的推薦效用以及累積嘗試。較高的推薦效用預(yù)示著較低的探索開銷,而較低的累積嘗試則表明較高的不確定性。為此,不同的算法都會(huì)設(shè)計(jì)特定的整合機(jī)制,使得同時(shí)具備較高推薦效用與不確定性物品可以得到優(yōu)先嘗試。 動(dòng)態(tài)場(chǎng)景下的強(qiáng)化推薦 在多臂老虎機(jī)的設(shè)定場(chǎng)景下,用戶的實(shí)時(shí)特征被假設(shè)為固定不變的,因此算法并未涉及用戶行為發(fā)生動(dòng)態(tài)遷移的情況。然而對(duì)于諸多現(xiàn)實(shí)中的推薦場(chǎng)景,用戶行為往往會(huì)在交互過程中不斷變化。這就要求推薦系統(tǒng)依照用戶反饋精確估計(jì)其狀態(tài)發(fā)展,并為之制定優(yōu)化的推薦策略。具體來講,一個(gè)理想的推薦系統(tǒng)應(yīng)滿足如下雙方面的屬性。一方面,推薦決策需要充分基于用戶過往的反饋數(shù)據(jù);另一方面,推薦系統(tǒng)需要優(yōu)化整個(gè)交互過程之中的全局收益。強(qiáng)化學(xué)習(xí)為實(shí)現(xiàn)上述目標(biāo)提供了有力的技術(shù)支持。 在強(qiáng)化學(xué)習(xí)的框架之下,推薦系統(tǒng)被視作一個(gè)智能體(agent),用戶當(dāng)前的行為特征被抽象成為狀態(tài)(state),待推薦的對(duì)象(如候選新聞)則被當(dāng)作動(dòng)作(action)。在每次推薦交互中,系統(tǒng)依據(jù)用戶的狀態(tài),選擇合適的動(dòng)作,以最大化特定的長(zhǎng)效目標(biāo)(如點(diǎn)擊總數(shù)或停留時(shí)長(zhǎng))。推薦系統(tǒng)與用戶交互過程中所產(chǎn)生的行為數(shù)據(jù)被組織成為經(jīng)驗(yàn)(experience),用以記錄相應(yīng)動(dòng)作產(chǎn)生的獎(jiǎng)勵(lì)(reward)以及狀態(tài)轉(zhuǎn)移(state-transition)。基于不斷積累的經(jīng)驗(yàn),強(qiáng)化學(xué)習(xí)算法得出策略(policy),用以指導(dǎo)特定狀態(tài)下最優(yōu)的動(dòng)作選取。 我們近期將強(qiáng)化學(xué)習(xí)成功應(yīng)用于必應(yīng)個(gè)性化新聞推薦(《DRN: A Deep Reinforcement Learning Framework for News Recommendation》,WWW 2018)。得益于算法的序列化決策能力及其對(duì)長(zhǎng)效目標(biāo)的優(yōu)化,強(qiáng)化學(xué)習(xí)必將服務(wù)于更為廣泛的現(xiàn)實(shí)場(chǎng)景,從而極大地改善推薦系統(tǒng)的用戶感知與個(gè)性化能力。 強(qiáng)化推薦的機(jī)遇與挑戰(zhàn) 強(qiáng)化學(xué)習(xí)推薦算法尚有諸多富有挑戰(zhàn)性的問題亟待解決。 現(xiàn)行主流的深度強(qiáng)化學(xué)習(xí)算法都試圖避開對(duì)環(huán)境的建模,而直接進(jìn)行策略學(xué)習(xí)(即 model-free)。這就要求海量的經(jīng)驗(yàn)數(shù)據(jù)以獲取最優(yōu)的推薦策略。然而,推薦場(chǎng)景下的可獲取的交互數(shù)據(jù)往往規(guī)模有限且獎(jiǎng)勵(lì)信號(hào)稀疏(reward-sparsity),這就使得簡(jiǎn)單地套用既有算法難以取得令人滿意的實(shí)際效果。如何運(yùn)用有限的用戶交互得到有效的決策模型將是算法進(jìn)一步提升的主要方向。 此外,現(xiàn)實(shí)中人們往往需要對(duì)不同推薦場(chǎng)景進(jìn)行獨(dú)立的策略學(xué)習(xí)。不同場(chǎng)景下的策略互不相同,這就使得人們不得不花費(fèi)大量精力以對(duì)每個(gè)場(chǎng)景都進(jìn)行充分的數(shù)據(jù)采集。同時(shí),由于不具備通用性,既有策略難以迅速適應(yīng)新的推薦場(chǎng)景。面對(duì)這些挑戰(zhàn),人們需要盡可能地提出通用策略的學(xué)習(xí)機(jī)制,以打通算法在不同推薦場(chǎng)景間的壁壘,并增強(qiáng)其在變化場(chǎng)景中的魯棒性。 研究熱點(diǎn) 4:推薦系統(tǒng)中的用戶畫像 構(gòu)建推薦系統(tǒng)的核心任務(wù)之一在于如何準(zhǔn)確地分析出用戶的興趣特點(diǎn),也就是我們常說的用戶畫像。 簡(jiǎn)單說來,用戶畫像是指從用戶產(chǎn)生的各種數(shù)據(jù)中挖掘和抽取用戶在不同屬性上的標(biāo)簽,如年齡、性別、職業(yè)、收入、興趣等。完備且準(zhǔn)確的屬性標(biāo)簽將有力地揭示用戶本質(zhì)特征,因而極大地促進(jìn)精準(zhǔn)的個(gè)性化推薦。 用戶畫像研究的現(xiàn)狀和挑戰(zhàn) 目前,主流用戶畫像方法一般是基于機(jī)器學(xué)習(xí)尤其是有監(jiān)督學(xué)習(xí)的技術(shù)。這類方法從用戶數(shù)據(jù)中抽取特征來作為用戶的表示向量,并利用有用戶屬性標(biāo)簽的數(shù)據(jù)作為有標(biāo)注數(shù)據(jù)來訓(xùn)練用戶畫像預(yù)測(cè)模型,從而對(duì)更多的沒有標(biāo)簽的用戶的屬性進(jìn)行預(yù)測(cè)。 盡管目前的用戶畫像方法已經(jīng)取得了不錯(cuò)的效果并被廣泛應(yīng)用于實(shí)際推薦系統(tǒng)中,這些方法仍然存在一定的問題和挑戰(zhàn):
從多源異構(gòu)用戶數(shù)據(jù)中構(gòu)建深度、統(tǒng)一和動(dòng)態(tài)的用戶畫像 為了應(yīng)對(duì)上述挑戰(zhàn),我們認(rèn)為應(yīng)該從以下方面展開用戶畫像研究:
研究熱點(diǎn) 5:推薦系統(tǒng)的可解釋性 上文所述推薦系統(tǒng)研究大都將重心放在提高推薦準(zhǔn)確性上,與推薦對(duì)象的溝通考慮得不夠。近期,學(xué)者們開始關(guān)注推薦是否能夠以用戶容易接受的方式,充分抓住用戶心理,給出適當(dāng)?shù)睦优c用戶溝通。研究發(fā)現(xiàn),這樣的系統(tǒng)不僅能夠提升系統(tǒng)透明度,還能夠提高用戶對(duì)系統(tǒng)的信任和接受程度 、用戶選擇推薦產(chǎn)品的概率以及用戶滿意程度。設(shè)計(jì)這樣一個(gè)可解釋的推薦系統(tǒng)是我們的終極目標(biāo)。 作為推薦領(lǐng)域被探索得較少的一個(gè)方向,可解釋推薦的很多方面值得研究與探索。目前,我們?cè)诳紤]從下面三個(gè)方面進(jìn)行研究。 利用知識(shí)圖譜增強(qiáng)算法解釋能力 知識(shí)圖譜作為可讀性高的外部知識(shí)載體,給提高算法解釋能力提供了極大的可能性?,F(xiàn)有的可解釋推薦所生成的推薦解釋往往只局限于以物品為媒介、以用戶為媒介或者以特征為媒介中的某一種,對(duì)這三類媒介之間的關(guān)聯(lián)挖掘得還不夠。我們希望能夠利用知識(shí)圖譜,打通這三類媒介之間的關(guān)聯(lián),根據(jù)具體情況靈活選擇其中最合適的媒介對(duì)用戶進(jìn)行推薦與解釋。另外,我們還可能利用 Microsoft Concept Graph 這類概念圖譜,建立特征之間的可讀深度結(jié)構(gòu),從而用來代替目前解釋性極弱的深度學(xué)習(xí)網(wǎng)絡(luò),在提高可讀性的同時(shí)保證算法的準(zhǔn)確性。 在可解釋人工智能越來越重要的時(shí)代,將知識(shí)圖譜這類符號(hào)知識(shí) (symbolic knowledge) 和深度學(xué)習(xí)結(jié)合,會(huì)是極有前景的方向。 模型無關(guān)的可解釋推薦框架 目前可解釋推薦系統(tǒng)大多是針對(duì)特定的推薦模型設(shè)計(jì),可拓展性較弱,對(duì)于新興的推薦模型,例如含有深度神經(jīng)網(wǎng)絡(luò)的復(fù)雜、混合模型的解釋能力還不夠。如果有一個(gè)模型無關(guān)的可解釋推薦框架,就可以避免針對(duì)每個(gè)推薦系統(tǒng)分別設(shè)計(jì)解釋方案,從而提高方法的可拓展性。我們對(duì)此做了初步嘗試 (《A Reinforcement Learning Framework for Explainable Recommendation》,ICDM2018)。在這一工作中,我們提出用如下的強(qiáng)化學(xué)習(xí)框架(圖 2)來對(duì)任何推薦模型進(jìn)行解釋,同時(shí)確??赏卣剐浴⒔忉屇芰σ约敖忉屬|(zhì)量。 圖 2:模型無關(guān)的可解釋推薦強(qiáng)化學(xué)習(xí)框架 結(jié)合生成模型進(jìn)行對(duì)話式推薦 目前的推薦解釋往往形式是預(yù)先設(shè)定、千篇一律的(如預(yù)先設(shè)定推薦解釋是以用戶為媒介的)。這樣盡管也能根據(jù)用戶心理舉出一些例證,但是在溝通方式上還過于呆板。如果能用生成模型讓推薦系統(tǒng)“自創(chuàng)”一句通順甚至高情商的話,就可以在與用戶聊天的過程中進(jìn)行靈活、多變地推薦解釋了。我們團(tuán)隊(duì)與微軟小冰合作,在這方面進(jìn)行了一些嘗試,為小冰生成音樂推薦解釋。 我們認(rèn)為未來的推薦系統(tǒng)需要進(jìn)一步考慮推薦算法的效率與可拓展性、融合多源異構(gòu)的用戶行為數(shù)據(jù),并捕捉用戶長(zhǎng)短期的偏好;在推薦系統(tǒng)中結(jié)合知識(shí)圖譜推理、設(shè)計(jì)通用策略的學(xué)習(xí)機(jī)制、以及通過有限的用戶交互數(shù)據(jù)得到有效的決策模型是重要的研究方向;在可解釋性方面,我們需要借助知識(shí)圖譜來增強(qiáng)算法解釋能力、設(shè)計(jì)模型無關(guān)的可解釋推薦框架、并考慮結(jié)合生成模型進(jìn)行對(duì)話式推薦;最后,我們需要認(rèn)真關(guān)注用戶隱私問題,設(shè)計(jì)在不同平臺(tái)間共享用戶數(shù)據(jù)的機(jī)制,并建立面向推薦系統(tǒng)的統(tǒng)一用戶表示模型。我們相信個(gè)性化推薦系統(tǒng)將在準(zhǔn)確性、多樣性、計(jì)算效率、以及可解釋性多個(gè)不同的方向持續(xù)演進(jìn),最終解決用戶信息過載的困擾。 本文貢獻(xiàn)者:謝幸,練建勛,劉政,王希廷,吳方照,王鴻偉,陳仲夏 作者介紹 社會(huì)計(jì)算組 微軟亞洲研究院社會(huì)計(jì)算組致力于將計(jì)算機(jī)科學(xué)與社會(huì)學(xué)、心理學(xué)、認(rèn)知科學(xué)等領(lǐng)域相結(jié)合,基于用戶在各種異構(gòu)社交平臺(tái)上產(chǎn)生的大規(guī)模行為數(shù)據(jù),對(duì)用戶進(jìn)行全面和深度的理解,進(jìn)而為用戶提供更加智能和個(gè)性化的服務(wù)。該組目前的主要研究方向包括用戶建模、推薦系統(tǒng)、時(shí)空數(shù)據(jù)挖掘、圖數(shù)據(jù)挖掘、情感分析與個(gè)性化聊天系統(tǒng)等,其學(xué)術(shù)水平在社會(huì)計(jì)算、普適計(jì)算與數(shù)據(jù)挖掘等領(lǐng)域均享有盛名,并與微軟人工智能產(chǎn)品團(tuán)隊(duì)有著密切的合作關(guān)系。 新聞來源/微軟亞洲研究院社會(huì)計(jì)算組 編輯/王昕蔚 編審/郭泓斌 監(jiān)制/陳宇翔 頭節(jié)點(diǎn),關(guān)系,尾節(jié)點(diǎn)> |
|
|