电竞比分网-中国电竞赛事及体育赛事平台

分享

yahoo、網(wǎng)摘和tag...

 IT-man 2005-07-24

剛從老冒的Blog中得知Yahoo推出網(wǎng)摘了,開始感覺特別震驚,從365Key在國內(nèi)首先推出網(wǎng)摘以來,國內(nèi)類似的服務(wù)層出不窮,甚至SINA、SOHU等門戶站點也介入其中。這次如果Yahoo介入,也就代表國際知名網(wǎng)站對社會化書簽的重視了。研究了這個稱為MyWeb的服務(wù),感覺還是一個擴展的收藏夾,共享功能作得還不夠。這從它的宣傳口號:“My Web BETA Find it, Save it, Never forget it.”可以看出,目前也只支持IE的收藏夾導(dǎo)入。不過看說明,這個服務(wù)即將和Yahoo! 360開始捆綁,相信還是會有不少的用戶。

Yahoo的這種書簽服務(wù)和網(wǎng)摘、Tag的模式還是有很大差別,為什么搜索引擎不直接引入網(wǎng)摘和Tag呢? Ding Deng的文章中援引Danny Sullivan的分析,認為:沒有利用tagging所產(chǎn)生的元數(shù)據(jù)的原因是這些數(shù)據(jù)基本上都是沒有利用價值的, 因為它們當中含有因濫用和描述不當而產(chǎn)生的無用信息。

雖然Yahoo不想涉足網(wǎng)摘和Tag,倒有熱心人John Herren來幫忙。Yahoo! News Tag Soup Popular Tags就是一個Yahoo! News的weighted tag。他在How does this work?中透露了他的實現(xiàn)方式:

  • 每小時定時從Yahoo! News的RSS源獲取新聞信息。
  • 將新聞信息導(dǎo)入MySQL數(shù)據(jù)庫,通過MySQL的索引來避免重復(fù)的新聞。
  • 然后使用Yahoo!提供的Content Analysis web service(內(nèi)容分析Web服務(wù))分析出關(guān)鍵詞(tag),并和新聞關(guān)聯(lián)。
  • 有了以上數(shù)據(jù),就可以通過CSS來輸出weighted tag了。
  • 點擊每個Tag就能看到所有的新聞,每篇新聞還羅列了所有相關(guān)的tag。

這種方式非常有趣,讓Yahoo!暫時也tag起來了,不過也有些限制。首先,Content Analysis web service其實是一種萃取(Extraction)服務(wù),萃取出來的多半是文章的一些關(guān)鍵詞,這和Tag這種大眾分類(folksonomy)有些區(qū)別。其次Content Analysis web service限制每天5000個分析請求,如果需要處理的新聞多于這個數(shù)量,就沒有辦法了。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多