电竞比分网-中国电竞赛事及体育赛事平台

分享

今日頭條的推薦機(jī)制,怎么可以推薦更多人呢?

 水針智客 2016-12-12

機(jī)器能聰明地將文章精準(zhǔn)地推薦給可能感興趣的用戶,是因?yàn)樗饶堋缸x懂」文章在講什么,又能「猜出」用戶想看到什么。

一、機(jī)器是怎樣理解你的文章的?

在門戶網(wǎng)站和傳統(tǒng)新聞客戶端上,哪些文章能上首頁(yè)是由編輯們決定的,編輯們會(huì)在閱讀完文章后,會(huì)決定是否將其推上版面。因?yàn)槊總€(gè)用戶看到的頁(yè)面都是相同的,編輯們的工作量雖然大,但還能夠應(yīng)付。

而在今日頭條客戶端上,每位用戶的信息流都是完全不同的,如果5億用戶的信息流都交由編輯來(lái)推薦,則是一件不可能完成的任務(wù)。

但是機(jī)器可以做到,因?yàn)槠洹搁喿x」文章的方式,在速度上要遠(yuǎn)遠(yuǎn)勝過(guò)人類。

系統(tǒng)會(huì)對(duì)文章進(jìn)行特征識(shí)別,從而判斷文章講的是什么類型和領(lǐng)域的內(nèi)容。特征識(shí)別的維度有很多,在這里我們重點(diǎn)解釋「關(guān)鍵詞」。

系統(tǒng)會(huì)根據(jù)文章中出現(xiàn)的頻率,提取出一些詞語(yǔ)作為關(guān)鍵詞,關(guān)鍵詞的判定原則有二:

· 詞頻高:如一篇體育類文章內(nèi)容關(guān)于某場(chǎng)足球比賽,那么文章可能會(huì)出現(xiàn)的高頻詞就包括球員名字、足球術(shù)語(yǔ)或技巧等,如「C 羅」、「射門」、「突破」。

· 同類文章中出現(xiàn)次數(shù)少:作者撰文時(shí)常用到的虛詞、轉(zhuǎn)折詞等出現(xiàn)頻率也很高,但它們不會(huì)作為關(guān)鍵詞被提取出來(lái),因?yàn)檫@些詞在文章中是普遍存在的。

系統(tǒng)判定出一篇文章的關(guān)鍵詞后,會(huì)將這些關(guān)鍵詞與文章分類模型進(jìn)行比對(duì),命中哪些分類詞庫(kù)關(guān)鍵詞的比例大,文章即被打上該分類的標(biāo)簽。如,一篇文章排名靠前的關(guān)鍵詞為「C 羅」、「射門」、「西甲」、「馬德里」,那么該篇文章可能會(huì)被打上「足球」、「國(guó)際足球」、「西班牙」等標(biāo)簽。機(jī)器便是這樣,完成對(duì)文章的初步認(rèn)知。

因?yàn)檫@種關(guān)鍵詞識(shí)別機(jī)制的存在,作者應(yīng)盡量避免在文中過(guò)度使用非常規(guī)詞語(yǔ),如活久見、腿玩年、城會(huì)玩等,給自己的文章增加理解障礙。行文用詞規(guī)范,機(jī)器可能更懂你的文章。

除文章正文關(guān)鍵詞識(shí)別外,機(jī)器還會(huì)對(duì)標(biāo)題進(jìn)行關(guān)鍵詞的識(shí)別和分類比對(duì)。因此,在標(biāo)題中露出具代表性的實(shí)體詞,可幫助機(jī)器理解你的文章。例如,同樣一篇足球類文章,標(biāo)題「大胡子梅西,大胡子阿奎羅,大胡子伊瓜因,阿根廷美洲杯冠軍穩(wěn)了!」,就比標(biāo)題「三人蓄須明志,誓要實(shí)現(xiàn)多年遠(yuǎn)大理想」含義更明確,更利于系統(tǒng)識(shí)別,獲得更多的推薦量。

二、你的文章會(huì)被推薦給哪些用戶?

每個(gè)人的閱讀興趣都是大不相同的,個(gè)性化推薦機(jī)制要做的事情就是——讓每位用戶看到可能感興趣的內(nèi)容,這也是用戶每天會(huì)「沉迷」在今日頭條上的原因。

因此反過(guò)來(lái),作者創(chuàng)作的內(nèi)容也就只會(huì)被推薦給可能對(duì)它感興趣的用戶。比如,某一篇關(guān)于C羅的足球文章寫得極出色,閱讀量超過(guò)了100萬(wàn),放在朋友圈是可以刷屏的爆款文章,但對(duì)足球毫無(wú)興趣的用戶在今日頭條上仍然是看不到這篇文章的。

這種精準(zhǔn)推薦,是建立在機(jī)器對(duì)每位用戶都有充分認(rèn)知的前提下的。在機(jī)器中,每位用戶實(shí)際是由大量數(shù)據(jù)構(gòu)成的,用戶的閱讀興趣就藏在這些數(shù)據(jù)中。

不同數(shù)據(jù)對(duì)用戶興趣計(jì)算所占權(quán)重不同,數(shù)據(jù)包括:

· 用戶的基本信息

性別、年齡、所處地理位置(城市或地區(qū));

使用機(jī)型、授權(quán)賬戶(如微博、微信等)、手機(jī)上經(jīng)常使用的其他 App 等;

· 用戶主動(dòng)訂閱或喜歡的內(nèi)容

訂閱賬號(hào);

訂閱頻道;

關(guān)注的話題;

· 機(jī)器通過(guò)計(jì)算得出的用戶閱讀興趣

用戶閱讀過(guò)的文章分類和關(guān)鍵詞;

用戶聚類:相似類型用戶還喜歡閱讀的其他文章類型;

用戶在今日頭條客戶端主動(dòng)標(biāo)記「不感興趣」的實(shí)體詞或文章類型;

根據(jù)以上數(shù)據(jù),系統(tǒng)對(duì)用戶的閱讀興趣就能有個(gè)基本的判斷。一般來(lái)講,用戶使用產(chǎn)品時(shí)間越長(zhǎng),系統(tǒng)積累的閱讀數(shù)據(jù)越多,對(duì)其興趣的判斷也就越準(zhǔn)確。使用產(chǎn)品的用戶越多,系統(tǒng)對(duì)用戶聚類的判斷也越準(zhǔn)確。

通過(guò)對(duì)數(shù)據(jù)的處理,每位用戶將被機(jī)器打上各種標(biāo)簽,如一個(gè)用戶閱讀的文章中關(guān)鍵詞排名靠前的是:C 羅、皇家馬德里、歐洲杯、小米、魅族、蘋果。那么,這位用戶可能被打上「足球」、「皇馬」、「科技」、「手機(jī)」、「米粉」等標(biāo)簽。不同的用戶會(huì)被打上不同的標(biāo)簽。

當(dāng)一篇帶有「C 羅」、「足球」標(biāo)簽的文章在進(jìn)行推薦時(shí),系統(tǒng)會(huì)將其自動(dòng)匹配給帶有「C 羅」或「足球」標(biāo)簽的用戶,這便是推薦引擎的個(gè)性化推薦。當(dāng)然,系統(tǒng)推薦的實(shí)際情況會(huì)遠(yuǎn)比這復(fù)雜得多,但推薦的基本原理便是,機(jī)器通過(guò)數(shù)據(jù)來(lái)理解文章和用戶,并對(duì)兩者進(jìn)行匹配。

三、你的文章是如何被被推薦的?

為讓受歡迎的內(nèi)容被更多用戶看到,不受歡迎的內(nèi)容不占用過(guò)多推薦資源。頭條號(hào)文章在推薦時(shí),會(huì)分批次推薦給對(duì)其感興趣的用戶。

如何理解分批次推薦呢?文章首先會(huì)被推薦給一批對(duì)其最可能感興趣的用戶(這批用戶的閱讀標(biāo)簽與文章標(biāo)簽重合度最高,被系統(tǒng)認(rèn)定最可能對(duì)該文章感興趣。),這批用戶產(chǎn)生的閱讀數(shù)據(jù),將對(duì)文章下一次的推薦起到?jīng)Q定性作用。數(shù)據(jù)包括點(diǎn)擊率、收藏?cái)?shù)、評(píng)論數(shù)、轉(zhuǎn)發(fā)數(shù)、讀完率,頁(yè)面停留時(shí)間等,其中,點(diǎn)擊率占的權(quán)重最高。

這很好理解,能吸引眾多用戶點(diǎn)擊的文章自然會(huì)被認(rèn)為更可能是好文章。

延伸閱讀:

擴(kuò)大推薦機(jī)制(注意:以下舉例僅用于說(shuō)明點(diǎn)擊率對(duì)文章推薦的影響,不代表實(shí)際推薦情況)

文章的首次推薦,如果點(diǎn)擊率低,系統(tǒng)認(rèn)為文章不適合推薦給更多的用戶,會(huì)減少二次推薦的推薦量;如果點(diǎn)擊率高,系統(tǒng)則認(rèn)為文章受用戶喜歡,將進(jìn)一步增加推薦量。以此類推,文章新一次的推薦量都以上一次推薦的點(diǎn)擊率為依據(jù)。此外,文章過(guò)了時(shí)效期后,推薦量將明顯衰減,時(shí)效期節(jié)點(diǎn)通常為24小時(shí)、72小時(shí)和一周。

例如,一篇文章首次推薦給了1000個(gè)用戶,如果這批用戶的點(diǎn)擊率較高,系統(tǒng)判定用戶非常喜歡這篇文章,將其擴(kuò)大推薦給10000個(gè)用戶,如果這輪推薦用戶的點(diǎn)擊率仍然維持在較高水平,那么系統(tǒng)會(huì)將文章再次擴(kuò)大推薦給30000個(gè)用戶、50000個(gè)用戶、100000個(gè)用戶 ······推薦量和閱讀量便如滾雪球一般節(jié)節(jié)攀升。直到文章過(guò)了24小時(shí)時(shí)效期,新一輪推薦的推薦量才會(huì)逐漸衰減。

因?yàn)檫@種擴(kuò)大推薦的機(jī)制,作者想獲得更多的閱讀量,就必須努力把各維度閱讀數(shù)據(jù)(點(diǎn)擊率、用戶閱讀時(shí)間、收藏?cái)?shù)、評(píng)論數(shù)、轉(zhuǎn)發(fā)數(shù)等)維持在高位水平。這就要求文章:

· 標(biāo)題和封面圖具有足夠的吸引力、表意清晰(提高點(diǎn)擊率)

· 圖文并茂,易讀性強(qiáng)(提高用戶閱讀時(shí)間)

· 內(nèi)容詳實(shí),給讀者干貨般的充實(shí)感(提高收藏?cái)?shù)和用戶閱讀時(shí)間)

· 觀點(diǎn)鮮明,引發(fā)讀者討論(增加評(píng)論數(shù)和轉(zhuǎn)發(fā)數(shù))

其中,至關(guān)重要的當(dāng)然是點(diǎn)擊率,也因此,標(biāo)題和封面圖的重要性便不言而喻。這也是今天注意力稀缺時(shí)代,文章獲得好的傳播的關(guān)鍵要素。

有吸引力的標(biāo)題能帶來(lái)更多點(diǎn)擊,但這不意味作者要成為慣用夸張標(biāo)題的標(biāo)題黨。恰恰相反,標(biāo)題黨反而會(huì)被平臺(tái)通過(guò)技術(shù)手段(標(biāo)題黨模型等)識(shí)別和打壓,限制推薦量。

除了標(biāo)題夸張,用戶舉報(bào)密集、負(fù)面評(píng)論過(guò)多、無(wú)效異常點(diǎn)擊、時(shí)效期已過(guò)都是限制文章推薦量的因素。

今日頭條的推薦機(jī)制,怎么可以推薦更多人呢?

四、為什么會(huì)產(chǎn)生推薦效果不好的情況?

常有作者抱怨自己的某篇文章推薦效果不好,或者對(duì)自己的文章閱讀量不穩(wěn)定感到焦慮。文章的閱讀量由系統(tǒng)推薦量直接決定,而推薦量又取決于上一輪推薦的點(diǎn)擊率。因此單篇文章推薦效果不好,原因無(wú)外乎三類:點(diǎn)擊率低、推薦量低、閱讀量低。

1.點(diǎn)擊率低

我們知道,低質(zhì)內(nèi)容對(duì)用戶閱讀體驗(yàn)會(huì)有負(fù)面影響。為了提升用戶體驗(yàn),機(jī)器會(huì)減少那些不受歡迎的內(nèi)容(即點(diǎn)擊率低的內(nèi)容)的展示量,如果點(diǎn)擊率持續(xù)走低,展示量也相應(yīng)地持續(xù)減少。

一般來(lái)說(shuō),如果初次點(diǎn)擊率不高,就很難再有較高的展示量和閱讀量。點(diǎn)擊率較低可能是如下原因?qū)е拢?/p>

· 賬號(hào)內(nèi)容垂直度較低,沒有及時(shí)推薦給相應(yīng)的用戶

假使一賬號(hào)是體育類賬號(hào),這一次卻發(fā)表了娛樂類內(nèi)容。對(duì)于這種不屬于賬號(hào)擅長(zhǎng)領(lǐng)域的文章,機(jī)器需要重新識(shí)別分類再進(jìn)行推薦,這在一定程度上會(huì)延長(zhǎng)推薦時(shí)間,不能保證在規(guī)定時(shí)效內(nèi),推薦給相應(yīng)的用戶。因此,作者若想保證較高水平的點(diǎn)擊率,堅(jiān)持創(chuàng)作垂直內(nèi)容是極有必要的。

· 文章內(nèi)容自身問(wèn)題,導(dǎo)致點(diǎn)擊率低

1. 標(biāo)題平淡,沒有起到吸引讀者閱讀的作用

2. 配圖無(wú)吸引力,文章配圖與內(nèi)容相關(guān)度不高,或者前三張圖片質(zhì)量較差

3. 內(nèi)容過(guò)于低質(zhì),引起讀者反感甚至投訴

2.推薦量低

推薦量是決定閱讀量大小的重要因素,推薦量低的主要原因有:

· 點(diǎn)擊率過(guò)低

· 潛在的用戶群過(guò)小,推薦量不高

如果賬號(hào)潛在的用戶群實(shí)在過(guò)小,機(jī)器將很難挖掘到**戶,推薦量自然高不了。而**戶群過(guò)小有如下原因:

1. 話題過(guò)于冷門、生僻

2. 涉及領(lǐng)域過(guò)于專業(yè),晦澀難懂,與主流群眾有一定距離

· 內(nèi)容供過(guò)于求

同一領(lǐng)域或話題相似內(nèi)容過(guò)多,出現(xiàn)了供過(guò)于求的現(xiàn)象。如,關(guān)于當(dāng)下熱點(diǎn)話題的談?wù)?,受眾雖然足夠多,但是內(nèi)容供給總量實(shí)在龐大,相應(yīng)地每一篇內(nèi)容得到的推薦量也就比較少。

· 消重機(jī)制會(huì)影響推薦量

文章非原創(chuàng)或者沒有在頭條號(hào)首先發(fā)布,文章可能會(huì)被消重,從而影響推薦量,可詳見消重部分。

· 時(shí)效短

時(shí)效性短的文章,實(shí)際推薦時(shí)間自然也短,而短時(shí)間內(nèi)可能將無(wú)法獲得較多的推薦量。

· 審核中被攔截,內(nèi)容不被系統(tǒng)推薦,可詳見文章審核部分。

3.閱讀量低

文章閱讀量低,與點(diǎn)擊率和推薦量有關(guān)。

· 推薦量低

在推薦量增長(zhǎng)到一定數(shù)量級(jí)之前,即使點(diǎn)擊率較高,文章閱讀量也不會(huì)高,因?yàn)閮?nèi)容并沒有得到大范圍的驗(yàn)證。在后續(xù)的推薦中,如果推薦量持續(xù)攀升,閱讀量可能會(huì)穩(wěn)步增長(zhǎng)。

· 點(diǎn)擊率低

如果推薦量已經(jīng)足夠高,閱讀量仍然較低,很可能是由于文章的點(diǎn)擊率較低。這就需要從賬號(hào)和文章出發(fā),堅(jiān)持發(fā)布垂直類內(nèi)容,努力提高文章的質(zhì)量。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多