电竞比分网-中国电竞赛事及体育赛事平台

分享

這5大研究熱點(diǎn)可能會(huì)改變個(gè)性化推薦系統(tǒng)的未來

 林九十七 2019-09-12

這5大研究熱點(diǎn)可能會(huì)改變個(gè)性化推薦系統(tǒng)的未來

作者 | 微軟亞洲研究院社會(huì)計(jì)算組

編輯 | Natalie

AI 前線導(dǎo)讀:本文將從深度學(xué)習(xí)的應(yīng)用、知識(shí)圖譜的應(yīng)用、強(qiáng)化學(xué)習(xí)的應(yīng)用、用戶畫像、可解釋推薦等幾個(gè)方面切入,看看未來推薦系統(tǒng)最重要的幾大研究方向。

“猜你喜歡”、“購買過此商品的用戶還購買過……”對(duì)于離不開社交平臺(tái)、電商、新聞閱讀、生活服務(wù)的現(xiàn)代互聯(lián)網(wǎng)用戶來說,個(gè)性化推薦已經(jīng)不是什么新鮮事兒。

隨著信息技術(shù)和互聯(lián)網(wǎng)行業(yè)的發(fā)展,信息過載成了人們處理信息的挑戰(zhàn)。對(duì)于用戶而言,如何在以指數(shù)增長(zhǎng)的資源中快速、準(zhǔn)確地定位到自己需要的內(nèi)容是一個(gè)非常重要且極具挑戰(zhàn)的事情。對(duì)于商家而言,如何把恰當(dāng)?shù)奈锲芳皶r(shí)呈現(xiàn)給用戶,從而促進(jìn)交易量和經(jīng)濟(jì)增長(zhǎng),也是一件頗具難度的事情。推薦系統(tǒng)的誕生極大地緩解了這個(gè)困難。

推薦系統(tǒng)是一種信息過濾系統(tǒng),能根據(jù)用戶的檔案或者歷史行為記錄,學(xué)習(xí)出用戶的興趣愛好,預(yù)測(cè)出用戶對(duì)給定物品的評(píng)分或偏好。它改變了商家與用戶的溝通方式,加強(qiáng)了和用戶之間的交互性。

據(jù)報(bào)道,推薦系統(tǒng)給亞馬遜帶來了 35% 的銷售收入,給 Netflix 帶來了高達(dá) 75% 的消費(fèi),并且 Youtube 主頁上 60% 的瀏覽來自推薦服務(wù)。

因此,如何搭建有效的推薦系統(tǒng)意義深遠(yuǎn)。我們將從深度學(xué)習(xí)的應(yīng)用、知識(shí)圖譜的應(yīng)用、強(qiáng)化學(xué)習(xí)的應(yīng)用、用戶畫像、可解釋推薦等幾個(gè)方面,一起看看推薦系統(tǒng)的未來。

研究熱點(diǎn) 1:推薦系統(tǒng)與深度學(xué)習(xí)

近幾年深度學(xué)習(xí)的技術(shù)應(yīng)用在語音識(shí)別、計(jì)算機(jī)視覺和自然語言理解等領(lǐng)域,取得了巨大的成功。如何將其應(yīng)用到推薦系統(tǒng)是當(dāng)前的研究熱點(diǎn)。深度推薦系統(tǒng)現(xiàn)階段的應(yīng)用主要體現(xiàn)在如下三個(gè)層面:

提升表征學(xué)習(xí)能力。深度神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)在于其強(qiáng)大的表征學(xué)習(xí)能力。因此,一種最直接的應(yīng)用是,利用深度學(xué)習(xí)技術(shù)從復(fù)雜的內(nèi)容數(shù)據(jù)中學(xué)習(xí)出有效的隱因子特征表示,從而后續(xù)可以很方便地為推薦系統(tǒng)所用。

深度協(xié)同過濾。經(jīng)典的矩陣分解模型可以被描述為一種非常簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)。我們可以通過拓展其中的結(jié)構(gòu),引入更多的非線性單元來加強(qiáng)推薦模型的功能。例如,在 WWW 2017 論文《Neural collaborative filtering》中,作者提出了加強(qiáng)版的矩陣分解模型。一方面,它彌補(bǔ)了兩個(gè)隱向量的樸素點(diǎn)積操作不能區(qū)分各維度之間重要性差別的弱點(diǎn);另一方面,它額外引入了一個(gè)多層感知機(jī)模塊,用來引入更多的非線性操作。除此之外,自動(dòng)編碼機(jī)、卷積神經(jīng)網(wǎng)絡(luò)、記憶網(wǎng)絡(luò)、注意力網(wǎng)絡(luò)等深度學(xué)習(xí)相關(guān)技術(shù)也分別被應(yīng)用在改進(jìn)傳統(tǒng)的協(xié)同過濾模型中,取得了不錯(cuò)的效果。

特征間的深度交互。企業(yè)級(jí)的推薦系統(tǒng)為了盡量提高模型的準(zhǔn)確性,往往會(huì)使用豐富的甚至異構(gòu)的內(nèi)容數(shù)據(jù)。這些特征從不同的維度展現(xiàn)了不同的信息,而且特征間的組合通常是非常有意義的。傳統(tǒng)的交叉特征是由工程師手動(dòng)設(shè)計(jì)的,這有很大的局限性,成本很高,并且不能拓展到未曾出現(xiàn)過的交叉模式中。因此學(xué)者們開始研究用神經(jīng)網(wǎng)絡(luò)去自動(dòng)學(xué)習(xí)高階的特征交互模式,彌補(bǔ)人工特征工程帶來的種種局限性。這個(gè)層面相關(guān)的模型包括 Wide&Deep、PNN、DeepFM、DCN、以及我們近期提出的 xDeepFM 模型 (《xDeepFM: Combining Explicit and Implicit Feature Interactions for Recommender Systems》,KDD 2018) 等。

深度學(xué)習(xí)技術(shù)在推薦系統(tǒng)中的應(yīng)用前景很廣闊。下面簡(jiǎn)要介紹幾個(gè)未來可能的研究方向:

效率與可拓展性

對(duì)于工業(yè)界推薦系統(tǒng)而言,不僅需要考慮模型的準(zhǔn)確度,運(yùn)行效率和可維護(hù)性也是非常重要的方面。效率指的是當(dāng)用戶發(fā)來一個(gè)請(qǐng)求時(shí),推薦系統(tǒng)能夠以接近實(shí)時(shí)的速度返回結(jié)果,而不需讓用戶等待;可維護(hù)性指系統(tǒng)的部署簡(jiǎn)便,能夠支持定期更新,或者增量式更新。眾所周知,復(fù)雜神經(jīng)網(wǎng)絡(luò)的計(jì)算量是龐大的,如何將它們更高效的應(yīng)用在超大規(guī)模的推薦平臺(tái)上,是亟需解決的技術(shù)難點(diǎn)。

多樣化數(shù)據(jù)融合

現(xiàn)實(shí)平臺(tái)中,用戶或者物品的數(shù)據(jù)往往是復(fù)雜多樣的。物品的內(nèi)容可以包括文本、圖像、類別等數(shù)據(jù);用戶的行為數(shù)據(jù)可以來自多個(gè)領(lǐng)域,例如社交網(wǎng)絡(luò)、搜索引擎、新聞閱讀應(yīng)用等;用戶的行為反饋也可以是豐富多樣的,例如電商網(wǎng)站中,用戶的行為可能有搜索、瀏覽、點(diǎn)擊、收藏、購買等。不僅如此,在這些不同的維度中,不同用戶或物品的數(shù)據(jù)分布也千差萬別;用戶在不同的行為反饋上的數(shù)據(jù)量也不同,點(diǎn)擊行為的數(shù)據(jù)量往往遠(yuǎn)大于購買行為的數(shù)據(jù)量。因此,單一、同構(gòu)的模型是不能有效地處理這些多樣化的數(shù)據(jù)的。如何深度融合這些復(fù)雜數(shù)據(jù)是一個(gè)技術(shù)難點(diǎn)。

捕捉用戶長(zhǎng)短期偏好

用戶的偏好大致可以分為長(zhǎng)期和短期兩類。長(zhǎng)期偏好往往指用戶的興趣所在,例如她是五月天的歌迷,那么未來很長(zhǎng)時(shí)間她都會(huì)對(duì)五月天的歌曲、演唱會(huì)門票感興趣;短期偏好指的是用戶在當(dāng)前環(huán)境下的即時(shí)興趣,例如最近一周用戶比較喜歡聽抖音上的熱門歌曲,那么推薦系統(tǒng)也應(yīng)該捕捉到用戶的這個(gè)興趣,或者用戶在未來一個(gè)月有搬家的打算,那么推薦系統(tǒng)可以適當(dāng)?shù)赝扑鸵恍┌峒夜镜膹V告。目前一些流行的做法是,將循環(huán)神經(jīng)網(wǎng)絡(luò)與深度協(xié)同過濾技術(shù)結(jié)合,從而達(dá)到兼顧長(zhǎng)短期記憶的功能。如何結(jié)合情境因素的影響,將用戶的長(zhǎng)期偏好與短期需求更緊密、有效地結(jié)合起來,也是一個(gè)研究熱點(diǎn)。

研究熱點(diǎn) 2:推薦系統(tǒng)與知識(shí)圖譜

在多數(shù)推薦場(chǎng)景中,物品可能包含豐富的知識(shí)信息,而刻畫這些知識(shí)的網(wǎng)絡(luò)結(jié)構(gòu)即被稱為知識(shí)圖譜。物品端的知識(shí)圖譜極大地?cái)U(kuò)展了物品的信息,強(qiáng)化了物品之間的聯(lián)系,為推薦提供了豐富的參考價(jià)值,更能為推薦結(jié)果帶來額外的多樣性和可解釋性 (圖 1)。

這5大研究熱點(diǎn)可能會(huì)改變個(gè)性化推薦系統(tǒng)的未來

圖 1:利用知識(shí)圖譜發(fā)掘新聞間的潛在相關(guān)性

和社交網(wǎng)絡(luò)相比,知識(shí)圖譜是一種異構(gòu)網(wǎng)絡(luò),因此針對(duì)知識(shí)圖譜的推薦算法設(shè)計(jì)要更復(fù)雜和精巧。近年來,網(wǎng)絡(luò)特征學(xué)習(xí) (network representation learning) 逐漸成為機(jī)器學(xué)習(xí)中的一個(gè)熱門的研究方向。引入網(wǎng)絡(luò)特征學(xué)習(xí)的方法處理推薦系統(tǒng)中知識(shí)圖譜的相關(guān)信息,有助于增強(qiáng)推薦系統(tǒng)的學(xué)習(xí)能力,提高精確度和用戶滿意度。

將知識(shí)圖譜引入推薦系統(tǒng),主要有如兩種不同的處理方式:

第一,基于特征的知識(shí)圖譜輔助推薦,核心是知識(shí)圖譜特征學(xué)習(xí)的引入。一般而言,知識(shí)圖譜是一個(gè)由三元組<頭節(jié)點(diǎn),關(guān)系,尾節(jié)點(diǎn)> 組成的異構(gòu)網(wǎng)絡(luò)。由于知識(shí)圖譜天然的高維性和異構(gòu)性,首先使用知識(shí)圖譜特征學(xué)習(xí)對(duì)其進(jìn)行處理,從而得到實(shí)體和關(guān)系的低維稠密向量表示。這些低維的向量表示可以較為自然地與推薦系統(tǒng)進(jìn)行結(jié)合和交互。

在這種處理框架下,推薦系統(tǒng)和知識(shí)圖譜特征學(xué)習(xí)事實(shí)上就成為兩個(gè)相關(guān)的任務(wù)。而依據(jù)其訓(xùn)練次序不同,又有兩種結(jié)合形式:

  1. 知識(shí)圖譜特征與推薦系統(tǒng)依次進(jìn)行學(xué)習(xí),即先學(xué)習(xí)特征,再將所學(xué)特征用于推薦。

  2. 交替學(xué)習(xí)法,將知識(shí)圖譜特征學(xué)習(xí)和推薦系統(tǒng)視為兩個(gè)相關(guān)的任務(wù),設(shè)計(jì)一種多任務(wù)學(xué)習(xí)框架,交替優(yōu)化二者的目標(biāo)函數(shù), 利用知識(shí)圖譜特征學(xué)習(xí)任務(wù)輔助推薦系統(tǒng)任務(wù)的學(xué)習(xí)。

第二,基于結(jié)構(gòu)的推薦模型,則更加直接地使用知識(shí)圖譜的結(jié)構(gòu)特征。具體來說,對(duì)于知識(shí)圖譜中的每一個(gè)實(shí)體,我們都進(jìn)行寬度優(yōu)先搜索來獲取其在知識(shí)圖譜中的多跳關(guān)聯(lián)實(shí)體從中得到推薦結(jié)果。根據(jù)利用關(guān)聯(lián)實(shí)體的技術(shù)的不同,可分向外傳播法和向內(nèi)聚合法兩種方法:

  • 向外傳播法模擬了用戶的興趣在知識(shí)圖譜上的傳播過程。我們近期的工作 RippleNet (《RippleNet: Propagating User Preferences on the Knowledge Graph for Recommender Systems》, CIKM 2018) 使用了向外傳播法,將每個(gè)用戶的歷史興趣作為知識(shí)圖譜上的種子集合,沿著知識(shí)圖譜中的鏈接迭代地向外擴(kuò)展。

  • 向內(nèi)聚合法在學(xué)習(xí)知識(shí)圖譜實(shí)體特征的時(shí)候聚合了該實(shí)體的鄰居特征表示。通過鄰居聚合的操作,每個(gè)實(shí)體的特征的計(jì)算都結(jié)合了其鄰近結(jié)構(gòu)信息,且權(quán)值是由鏈接關(guān)系和特定的用戶決定的,這同時(shí)刻畫了知識(shí)圖譜的語義信息和用戶的個(gè)性化興趣。

結(jié)合知識(shí)圖譜推薦系統(tǒng)的機(jī)遇與挑戰(zhàn)

將推薦算法與知識(shí)圖譜的圖計(jì)算方法相結(jié)合已逐漸成為學(xué)術(shù)熱點(diǎn),前景廣闊。然而現(xiàn)有方法仍有一定局限,有充分的研究空間。首先,現(xiàn)有模型都屬于統(tǒng)計(jì)學(xué)習(xí)模型,即挖掘網(wǎng)絡(luò)中的統(tǒng)計(jì)學(xué)信息并以此進(jìn)行推斷。一個(gè)困難但更有研究前景的方向是在網(wǎng)絡(luò)中進(jìn)行推理,將圖推理與推薦系統(tǒng)相結(jié)合。其二,如何設(shè)計(jì)出性能優(yōu)秀且運(yùn)行效率高的算法,也是潛在的研究方向。現(xiàn)有模型并不涉及計(jì)算引擎層面、系統(tǒng)層面甚至硬件層面的考量,如何將上層算法和底層架構(gòu)進(jìn)行聯(lián)合設(shè)計(jì)和優(yōu)化,是實(shí)際應(yīng)用中一個(gè)亟待研究的問題。最后,現(xiàn)有的模型網(wǎng)絡(luò)結(jié)構(gòu)都是靜態(tài)的,在真實(shí)場(chǎng)景中,知識(shí)圖譜具有一定的時(shí)效。如何刻畫這種時(shí)間演變的網(wǎng)絡(luò),并在推薦時(shí)充分考慮時(shí)序信息,也值得我們未來研究。

研究熱點(diǎn) 3:推薦系統(tǒng)與強(qiáng)化學(xué)習(xí)

通過融合深度學(xué)習(xí)與知識(shí)圖譜技術(shù),推薦系統(tǒng)的性能取得了大幅的提升。然而,多數(shù)的推薦系統(tǒng)仍是以一步到位的方式建立的。它們有著類似的搭建方式,即在充分獲取用戶歷史數(shù)據(jù)的前提下,設(shè)計(jì)并訓(xùn)練特定的監(jiān)督模型,從而得到用戶對(duì)于不同物品的喜好程度。這些訓(xùn)練好的模型在部署上線后可以為特定用戶識(shí)別出最具吸引力的物品,為其做出個(gè)性化推薦。在此,人們往往假設(shè)用戶數(shù)據(jù)已充分獲取,且其行為會(huì)在較長(zhǎng)時(shí)間之內(nèi)保持穩(wěn)定,使得上述過程中所建立的推薦模型得以應(yīng)付實(shí)際中的需求。然而對(duì)于諸多現(xiàn)實(shí)場(chǎng)景,例如電子商務(wù)或者在線新聞平臺(tái),用戶與推薦系統(tǒng)之間往往會(huì)發(fā)生持續(xù)密切的交互行為。在這一過程中,用戶的反饋將彌補(bǔ)可能的數(shù)據(jù)缺失,同時(shí)有力地揭示其當(dāng)前的行為特征,從而為系統(tǒng)進(jìn)行更加精準(zhǔn)的個(gè)性化推薦提供重要的依據(jù)。

強(qiáng)化學(xué)習(xí)為解決這個(gè)問題提供了有力支持。依照用戶的行為特征,我們將涉及到的推薦場(chǎng)景劃分為靜態(tài)與動(dòng)態(tài),并分別對(duì)其進(jìn)行討論。

靜態(tài)場(chǎng)景下的強(qiáng)化推薦

在靜態(tài)場(chǎng)景之下,用戶的行為特征在與系統(tǒng)的交互過程中保持穩(wěn)定不變。對(duì)于這一場(chǎng)景,一類有代表性的工作是基于上下文多臂老虎機(jī)(contextual multi-armed bandit)的推薦系統(tǒng),它的發(fā)展為克服推薦場(chǎng)景中的冷啟動(dòng)問題提供了行之有效的解決方案。在許多現(xiàn)實(shí)應(yīng)用中,用戶的歷史行為往往服從特定的長(zhǎng)尾分布,即大多數(shù)用戶僅僅產(chǎn)生規(guī)模有限的歷史數(shù)據(jù),而極少的用戶則會(huì)生成較為充足的歷史數(shù)據(jù)。這一現(xiàn)象所帶來的數(shù)據(jù)稀疏問題使得傳統(tǒng)模型在很多時(shí)候難以得到令人滿意的實(shí)際效果。

為此,一個(gè)直接的應(yīng)對(duì)方法是對(duì)用戶行為進(jìn)行主動(dòng)式的探索,即通過對(duì)用戶發(fā)起大量嘗試性的推薦,以充分的獲得其行為數(shù)據(jù),從而保障推薦系統(tǒng)的可用性。然而不幸的是,這一簡(jiǎn)單的做法勢(shì)必引發(fā)極大的探索開銷,使得它在現(xiàn)實(shí)中并不具備可行性。為使主動(dòng)式探索具備可行的效用開銷,人們嘗試借助多臂老虎機(jī)問題所帶來的啟發(fā)。多臂老虎機(jī)問題旨在于“探索 - 利用”間做出最優(yōu)的權(quán)衡,為此諸多經(jīng)典算法,被相繼提出。盡管不同的算法有著不同的實(shí)施機(jī)制,它們的設(shè)計(jì)都本著一個(gè)共同的原則。

具體說來,系統(tǒng)在做出推薦的時(shí)候會(huì)綜合考慮物品的推薦效用以及累積嘗試。較高的推薦效用預(yù)示著較低的探索開銷,而較低的累積嘗試則表明較高的不確定性。為此,不同的算法都會(huì)設(shè)計(jì)特定的整合機(jī)制,使得同時(shí)具備較高推薦效用與不確定性物品可以得到優(yōu)先嘗試。

動(dòng)態(tài)場(chǎng)景下的強(qiáng)化推薦

在多臂老虎機(jī)的設(shè)定場(chǎng)景下,用戶的實(shí)時(shí)特征被假設(shè)為固定不變的,因此算法并未涉及用戶行為發(fā)生動(dòng)態(tài)遷移的情況。然而對(duì)于諸多現(xiàn)實(shí)中的推薦場(chǎng)景,用戶行為往往會(huì)在交互過程中不斷變化。這就要求推薦系統(tǒng)依照用戶反饋精確估計(jì)其狀態(tài)發(fā)展,并為之制定優(yōu)化的推薦策略。具體來講,一個(gè)理想的推薦系統(tǒng)應(yīng)滿足如下雙方面的屬性。一方面,推薦決策需要充分基于用戶過往的反饋數(shù)據(jù);另一方面,推薦系統(tǒng)需要優(yōu)化整個(gè)交互過程之中的全局收益。強(qiáng)化學(xué)習(xí)為實(shí)現(xiàn)上述目標(biāo)提供了有力的技術(shù)支持。

在強(qiáng)化學(xué)習(xí)的框架之下,推薦系統(tǒng)被視作一個(gè)智能體(agent),用戶當(dāng)前的行為特征被抽象成為狀態(tài)(state),待推薦的對(duì)象(如候選新聞)則被當(dāng)作動(dòng)作(action)。在每次推薦交互中,系統(tǒng)依據(jù)用戶的狀態(tài),選擇合適的動(dòng)作,以最大化特定的長(zhǎng)效目標(biāo)(如點(diǎn)擊總數(shù)或停留時(shí)長(zhǎng))。推薦系統(tǒng)與用戶交互過程中所產(chǎn)生的行為數(shù)據(jù)被組織成為經(jīng)驗(yàn)(experience),用以記錄相應(yīng)動(dòng)作產(chǎn)生的獎(jiǎng)勵(lì)(reward)以及狀態(tài)轉(zhuǎn)移(state-transition)。基于不斷積累的經(jīng)驗(yàn),強(qiáng)化學(xué)習(xí)算法得出策略(policy),用以指導(dǎo)特定狀態(tài)下最優(yōu)的動(dòng)作選取。

我們近期將強(qiáng)化學(xué)習(xí)成功應(yīng)用于必應(yīng)個(gè)性化新聞推薦(《DRN: A Deep Reinforcement Learning Framework for News Recommendation》,WWW 2018)。得益于算法的序列化決策能力及其對(duì)長(zhǎng)效目標(biāo)的優(yōu)化,強(qiáng)化學(xué)習(xí)必將服務(wù)于更為廣泛的現(xiàn)實(shí)場(chǎng)景,從而極大地改善推薦系統(tǒng)的用戶感知與個(gè)性化能力。

強(qiáng)化推薦的機(jī)遇與挑戰(zhàn)

強(qiáng)化學(xué)習(xí)推薦算法尚有諸多富有挑戰(zhàn)性的問題亟待解決。

現(xiàn)行主流的深度強(qiáng)化學(xué)習(xí)算法都試圖避開對(duì)環(huán)境的建模,而直接進(jìn)行策略學(xué)習(xí)(即 model-free)。這就要求海量的經(jīng)驗(yàn)數(shù)據(jù)以獲取最優(yōu)的推薦策略。然而,推薦場(chǎng)景下的可獲取的交互數(shù)據(jù)往往規(guī)模有限且獎(jiǎng)勵(lì)信號(hào)稀疏(reward-sparsity),這就使得簡(jiǎn)單地套用既有算法難以取得令人滿意的實(shí)際效果。如何運(yùn)用有限的用戶交互得到有效的決策模型將是算法進(jìn)一步提升的主要方向。

此外,現(xiàn)實(shí)中人們往往需要對(duì)不同推薦場(chǎng)景進(jìn)行獨(dú)立的策略學(xué)習(xí)。不同場(chǎng)景下的策略互不相同,這就使得人們不得不花費(fèi)大量精力以對(duì)每個(gè)場(chǎng)景都進(jìn)行充分的數(shù)據(jù)采集。同時(shí),由于不具備通用性,既有策略難以迅速適應(yīng)新的推薦場(chǎng)景。面對(duì)這些挑戰(zhàn),人們需要盡可能地提出通用策略的學(xué)習(xí)機(jī)制,以打通算法在不同推薦場(chǎng)景間的壁壘,并增強(qiáng)其在變化場(chǎng)景中的魯棒性。

研究熱點(diǎn) 4:推薦系統(tǒng)中的用戶畫像

構(gòu)建推薦系統(tǒng)的核心任務(wù)之一在于如何準(zhǔn)確地分析出用戶的興趣特點(diǎn),也就是我們常說的用戶畫像。

簡(jiǎn)單說來,用戶畫像是指從用戶產(chǎn)生的各種數(shù)據(jù)中挖掘和抽取用戶在不同屬性上的標(biāo)簽,如年齡、性別、職業(yè)、收入、興趣等。完備且準(zhǔn)確的屬性標(biāo)簽將有力地揭示用戶本質(zhì)特征,因而極大地促進(jìn)精準(zhǔn)的個(gè)性化推薦。

用戶畫像研究的現(xiàn)狀和挑戰(zhàn)

目前,主流用戶畫像方法一般是基于機(jī)器學(xué)習(xí)尤其是有監(jiān)督學(xué)習(xí)的技術(shù)。這類方法從用戶數(shù)據(jù)中抽取特征來作為用戶的表示向量,并利用有用戶屬性標(biāo)簽的數(shù)據(jù)作為有標(biāo)注數(shù)據(jù)來訓(xùn)練用戶畫像預(yù)測(cè)模型,從而對(duì)更多的沒有標(biāo)簽的用戶的屬性進(jìn)行預(yù)測(cè)。

盡管目前的用戶畫像方法已經(jīng)取得了不錯(cuò)的效果并被廣泛應(yīng)用于實(shí)際推薦系統(tǒng)中,這些方法仍然存在一定的問題和挑戰(zhàn):

  • 首先,這些已有的方法大多數(shù)都基于手工抽取的離散特征,這些特征無法刻畫用戶數(shù)據(jù)的上下文信息,因此對(duì)于用戶的表征能力較為有限。

  • 其次,現(xiàn)有的用戶畫像方法通常基于簡(jiǎn)單的線性回歸或分類模型,無法從用戶數(shù)據(jù)中自動(dòng)學(xué)習(xí)高層次抽象特征,也無法對(duì)特征之間的交互關(guān)系進(jìn)行建模。另外,已有的用戶畫像方法往往基于單一類型和單一來源的數(shù)據(jù),這些數(shù)據(jù)對(duì)于用戶的表征不夠豐富。而實(shí)際上,用戶數(shù)據(jù)往往是多來源和多類型的。

  • 最后,已有的用戶畫像方法大都沒有考慮用戶屬性標(biāo)簽的時(shí)效性,因此很難刻畫用戶動(dòng)態(tài)變化的屬性如興趣等。

從多源異構(gòu)用戶數(shù)據(jù)中構(gòu)建深度、統(tǒng)一和動(dòng)態(tài)的用戶畫像

為了應(yīng)對(duì)上述挑戰(zhàn),我們認(rèn)為應(yīng)該從以下方面展開用戶畫像研究:

  1. 構(gòu)建具有更強(qiáng)表征能力的用戶表示模型。隨著深度學(xué)習(xí)技術(shù)的發(fā)展和成熟,利用深層神經(jīng)網(wǎng)絡(luò)從用戶原始數(shù)據(jù)中自動(dòng)抽取深層次的、有信息量的特征來構(gòu)建用戶的特征表示能夠有助于更加充分地利用用戶數(shù)據(jù)并有效提升用戶畫像的精度。使用基于深層神經(jīng)網(wǎng)絡(luò)的用戶表示模型能夠有效克服目前已有的基于特征工程和線性模型的用戶畫像方法的不足。我們提出的 HURA 模型 (《Neural Demographic Prediction using Search Query》, WSDM 2019) 基于多層注意力機(jī)制和神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),有效地通過搜索日志預(yù)測(cè)了用戶個(gè)人屬性。

  2. 基于多源和異構(gòu)數(shù)據(jù)的用戶畫像。用戶產(chǎn)生的數(shù)據(jù)往往分布在不同的平臺(tái),并且具有不同的結(jié)構(gòu)(如無結(jié)構(gòu)的社交媒體文本數(shù)據(jù)和有結(jié)構(gòu)的電商網(wǎng)站購買記錄等)和不同的模態(tài)(如文本數(shù)據(jù)和圖像數(shù)據(jù)),給用戶畫像帶來了很大的挑戰(zhàn)。如何設(shè)計(jì)一個(gè)深度信息融合模型來利用不同來源、不同結(jié)構(gòu)和不同模態(tài)的用戶數(shù)據(jù)進(jìn)行用戶建模, 是未來用戶畫像領(lǐng)域的一個(gè)重要方向?;谏疃壬窠?jīng)網(wǎng)絡(luò)的協(xié)同學(xué)習(xí)和多通道模型可能是值得嘗試的技術(shù)。

  3. 不同平臺(tái)用戶畫像數(shù)據(jù)的共享和用戶隱私保護(hù)。目前很多用戶數(shù)據(jù)存在于不同的平臺(tái)當(dāng)中,例如搜索引擎擁有用戶的搜索和網(wǎng)頁瀏覽記錄,電商網(wǎng)站擁有用戶的商品瀏覽、購物、收藏和購買信息。這些不同平臺(tái)的用戶數(shù)據(jù)對(duì)于用戶畫像都具有重要的價(jià)值,互相之間可以提供互補(bǔ)信息,有助于構(gòu)建更加豐富全面的用戶表示。然而,平臺(tái)之間直接共享用戶信息可能會(huì)使得用戶的隱私受到泄露和損害。如何在不轉(zhuǎn)移和不共享用戶數(shù)據(jù)的情況下,充分利用不同平臺(tái)的用戶信息實(shí)現(xiàn)協(xié)同用戶畫像和建模是值得研究的一個(gè)方向。

  4. 面向用戶畫像的統(tǒng)一用戶表示模型。已有的用戶畫像方法在實(shí)際的應(yīng)用中往往會(huì)涉及大量模型的訓(xùn)練、存儲(chǔ)和調(diào)用,時(shí)間和空間的復(fù)雜度都比較高,使用起來也比較繁瑣。另外,不同的用戶屬性之間潛在的聯(lián)系也無法充分挖掘。如何基于多源異構(gòu)的用戶數(shù)據(jù)構(gòu)建一個(gè)統(tǒng)一的用戶表示模型,使得該模型可以盡可能全面而準(zhǔn)確地包含一個(gè)用戶在不同屬性和維度的特征信息并能夠應(yīng)用于多個(gè)用戶畫像任務(wù)是一個(gè)非常值得研究的方向?;谏顚由窠?jīng)網(wǎng)絡(luò)的多任務(wù)學(xué)習(xí)技術(shù)和類似詞嵌入的用戶嵌入技術(shù)有希望能夠應(yīng)用于這個(gè)問題。

研究熱點(diǎn) 5:推薦系統(tǒng)的可解釋性

上文所述推薦系統(tǒng)研究大都將重心放在提高推薦準(zhǔn)確性上,與推薦對(duì)象的溝通考慮得不夠。近期,學(xué)者們開始關(guān)注推薦是否能夠以用戶容易接受的方式,充分抓住用戶心理,給出適當(dāng)?shù)睦优c用戶溝通。研究發(fā)現(xiàn),這樣的系統(tǒng)不僅能夠提升系統(tǒng)透明度,還能夠提高用戶對(duì)系統(tǒng)的信任和接受程度 、用戶選擇推薦產(chǎn)品的概率以及用戶滿意程度。設(shè)計(jì)這樣一個(gè)可解釋的推薦系統(tǒng)是我們的終極目標(biāo)。

作為推薦領(lǐng)域被探索得較少的一個(gè)方向,可解釋推薦的很多方面值得研究與探索。目前,我們?cè)诳紤]從下面三個(gè)方面進(jìn)行研究。

利用知識(shí)圖譜增強(qiáng)算法解釋能力

知識(shí)圖譜作為可讀性高的外部知識(shí)載體,給提高算法解釋能力提供了極大的可能性?,F(xiàn)有的可解釋推薦所生成的推薦解釋往往只局限于以物品為媒介、以用戶為媒介或者以特征為媒介中的某一種,對(duì)這三類媒介之間的關(guān)聯(lián)挖掘得還不夠。我們希望能夠利用知識(shí)圖譜,打通這三類媒介之間的關(guān)聯(lián),根據(jù)具體情況靈活選擇其中最合適的媒介對(duì)用戶進(jìn)行推薦與解釋。另外,我們還可能利用 Microsoft Concept Graph 這類概念圖譜,建立特征之間的可讀深度結(jié)構(gòu),從而用來代替目前解釋性極弱的深度學(xué)習(xí)網(wǎng)絡(luò),在提高可讀性的同時(shí)保證算法的準(zhǔn)確性。

在可解釋人工智能越來越重要的時(shí)代,將知識(shí)圖譜這類符號(hào)知識(shí) (symbolic knowledge) 和深度學(xué)習(xí)結(jié)合,會(huì)是極有前景的方向。

模型無關(guān)的可解釋推薦框架

目前可解釋推薦系統(tǒng)大多是針對(duì)特定的推薦模型設(shè)計(jì),可拓展性較弱,對(duì)于新興的推薦模型,例如含有深度神經(jīng)網(wǎng)絡(luò)的復(fù)雜、混合模型的解釋能力還不夠。如果有一個(gè)模型無關(guān)的可解釋推薦框架,就可以避免針對(duì)每個(gè)推薦系統(tǒng)分別設(shè)計(jì)解釋方案,從而提高方法的可拓展性。我們對(duì)此做了初步嘗試 (《A Reinforcement Learning Framework for Explainable Recommendation》,ICDM2018)。在這一工作中,我們提出用如下的強(qiáng)化學(xué)習(xí)框架(圖 2)來對(duì)任何推薦模型進(jìn)行解釋,同時(shí)確??赏卣剐浴⒔忉屇芰σ约敖忉屬|(zhì)量。

這5大研究熱點(diǎn)可能會(huì)改變個(gè)性化推薦系統(tǒng)的未來

圖 2:模型無關(guān)的可解釋推薦強(qiáng)化學(xué)習(xí)框架

結(jié)合生成模型進(jìn)行對(duì)話式推薦

目前的推薦解釋往往形式是預(yù)先設(shè)定、千篇一律的(如預(yù)先設(shè)定推薦解釋是以用戶為媒介的)。這樣盡管也能根據(jù)用戶心理舉出一些例證,但是在溝通方式上還過于呆板。如果能用生成模型讓推薦系統(tǒng)“自創(chuàng)”一句通順甚至高情商的話,就可以在與用戶聊天的過程中進(jìn)行靈活、多變地推薦解釋了。我們團(tuán)隊(duì)與微軟小冰合作,在這方面進(jìn)行了一些嘗試,為小冰生成音樂推薦解釋。

我們認(rèn)為未來的推薦系統(tǒng)需要進(jìn)一步考慮推薦算法的效率與可拓展性、融合多源異構(gòu)的用戶行為數(shù)據(jù),并捕捉用戶長(zhǎng)短期的偏好;在推薦系統(tǒng)中結(jié)合知識(shí)圖譜推理、設(shè)計(jì)通用策略的學(xué)習(xí)機(jī)制、以及通過有限的用戶交互數(shù)據(jù)得到有效的決策模型是重要的研究方向;在可解釋性方面,我們需要借助知識(shí)圖譜來增強(qiáng)算法解釋能力、設(shè)計(jì)模型無關(guān)的可解釋推薦框架、并考慮結(jié)合生成模型進(jìn)行對(duì)話式推薦;最后,我們需要認(rèn)真關(guān)注用戶隱私問題,設(shè)計(jì)在不同平臺(tái)間共享用戶數(shù)據(jù)的機(jī)制,并建立面向推薦系統(tǒng)的統(tǒng)一用戶表示模型。我們相信個(gè)性化推薦系統(tǒng)將在準(zhǔn)確性、多樣性、計(jì)算效率、以及可解釋性多個(gè)不同的方向持續(xù)演進(jìn),最終解決用戶信息過載的困擾。

本文貢獻(xiàn)者:謝幸,練建勛,劉政,王希廷,吳方照,王鴻偉,陳仲夏

作者介紹

社會(huì)計(jì)算組

微軟亞洲研究院社會(huì)計(jì)算組致力于將計(jì)算機(jī)科學(xué)與社會(huì)學(xué)、心理學(xué)、認(rèn)知科學(xué)等領(lǐng)域相結(jié)合,基于用戶在各種異構(gòu)社交平臺(tái)上產(chǎn)生的大規(guī)模行為數(shù)據(jù),對(duì)用戶進(jìn)行全面和深度的理解,進(jìn)而為用戶提供更加智能和個(gè)性化的服務(wù)。該組目前的主要研究方向包括用戶建模、推薦系統(tǒng)、時(shí)空數(shù)據(jù)挖掘、圖數(shù)據(jù)挖掘、情感分析與個(gè)性化聊天系統(tǒng)等,其學(xué)術(shù)水平在社會(huì)計(jì)算、普適計(jì)算與數(shù)據(jù)挖掘等領(lǐng)域均享有盛名,并與微軟人工智能產(chǎn)品團(tuán)隊(duì)有著密切的合作關(guān)系。

新聞來源/微軟亞洲研究院社會(huì)計(jì)算組

編輯/王昕蔚 編審/郭泓斌 監(jiān)制/陳宇翔

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多