电竞比分网-中国电竞赛事及体育赛事平台

分享

百度官方解答集:為什么蜘蛛天天來,而快照不更新呢?

 jmsxu 2016-02-22

聲明:以下均來自百度官方及相關人員的解答。

百度官方解答集:為什么蜘蛛天天來,而快照不更新呢?

1.為什么蜘蛛天天來,而快照不更新呢?

官方解答:蜘蛛天天來,你需要看蜘蛛是否只爬不抓,如果只爬不抓說明內容還是存在問題的,要加大原創(chuàng)力度,或者說蜘蛛是否很難抓取,另外蜘蛛來了也抓取了也不會很快就更新,這之間是有一個過程的,蜘蛛需要對抓取的內容進行判斷,并且快照也有一個緩存時間。一般情況下我們需要注意:

1、網(wǎng)站是否被降權,要是網(wǎng)站被降權了,要是網(wǎng)站被降權了,在搜索引擎那里屬于審核期,網(wǎng)站快照更新慢或不更新是很正常的。

2、網(wǎng)站是否被掛黑鏈,被掛大量黑鏈的網(wǎng)站也經常會快照不更新,需要定期查看網(wǎng)站是否被掛黑鏈。

3、網(wǎng)站速度問題,網(wǎng)站的加載速度會影響蜘蛛的正常抓取,一般情況下網(wǎng)站都是從上往下的加載,而有的時候由于速度因素導致網(wǎng)站只加載了頭部,后面部分而沒有及時顯示出來,也可能導致蜘蛛只抓取了頭部部分內容,而由于一般網(wǎng)站的頭部都是相同的,也就容易出現(xiàn)了抓取返回沒更新的狀態(tài)碼。

4、網(wǎng)站內容問題

網(wǎng)站內容長期采集或是偽原創(chuàng)也能導致蜘蛛返回304狀態(tài)碼,因為網(wǎng)站內容采集或偽原創(chuàng)的確會降低網(wǎng)站質量,導致百度不收錄等情況,搜索蜘蛛也會認為網(wǎng)站內容不具備收錄的意義,那么也就不會抓取新的內容而返回沒有更新的狀態(tài)。

5、長時間不更新,頁面長時間沒有更新也會導致快照不更新的情況,你不是高權重網(wǎng)站,也沒有大量其他外部來源,如果又長時間不更新,那么很可能就不更新快照。

6、蜘蛛問題,蜘蛛天天來,那來的到底是些什么蜘蛛呢?不是所有的蜘蛛來網(wǎng)站都會更新的,降權也說不定,所以我們需要分析網(wǎng)站日志,了解搜索引擎蜘蛛。

7、網(wǎng)頁上有時間戳,然后時間戳代碼長期沒更新產生了快照異常。

8、百度問題,有的時候百度在更新之后會出現(xiàn)一些問題,導致失誤,所以可以到百度快照投訴進行申訴。

9、百度會篩選一個最合適的快照進行展現(xiàn),如果你的最新的索引快照不如之前的好,那么還是會展現(xiàn)之前的快照。

后來經過分析,發(fā)現(xiàn)是因為網(wǎng)頁上的時間戳問題,經過修改和更新后恢復正常。

2.新網(wǎng)站、老域名如何才能讓百度快速收錄?

官方解答:首先了解該域名之前的內容,排除老域名因內容原因被百度懲罰。然后觀察Baiduspider來訪軌跡,確定是否有蜘蛛進行抓取。再看一下網(wǎng)頁狀態(tài)碼返回是否符合預期。如果都沒有問題,可以嘗試通過url提交工具http://zhanzhang.baidu.com/sitesubmit/index申請百度抓取。

3.網(wǎng)站不做偽靜態(tài)對收錄有沒有影響?

官方解答:對于不復雜的動態(tài)url,百度都可以搞定。

百度官方解答集:為什么蜘蛛天天來,而快照不更新呢?

4.偽原創(chuàng)內容對網(wǎng)站是否有壞處?

官方解答:視內容對用戶的價值,無價值的純粹的偽原創(chuàng)是會被打擊的。

5.我們的原創(chuàng)內容被XX網(wǎng)站采集,他們是新聞源,但我們不是,這種情況該怎么辦?

官方解答:百度傾向于收錄原創(chuàng)的新聞內容。

如果確實有此情況,可以向站長平臺的投訴反饋中心提交反饋。前提是你的網(wǎng)站不是因為被黑、軟文等低質內容被懲罰。

百度官方解答集:為什么蜘蛛天天來,而快照不更新呢?

6.網(wǎng)站title關鍵詞順序,是否影響排名?

官方解答:不影響。

7.純文本鏈接和錨文本鏈接,效果方面有啥區(qū)別?

官方解答:純文本還是錨文本并不重要,重要的是是否出現(xiàn)在有相關度的頁面上,百度現(xiàn)在對外鏈的依賴上已經很少了,研究這個意義不大。

8. 如果收錄都被建入低層庫的話,怎么辦?如何提升上來呢?

官方解答:主要 問題在于內容質量。

好網(wǎng)頁:無論從網(wǎng)站結構、怎么利于爬蟲抓取,還是從用戶體驗,用戶需求方面回答的始終有非常多信息來說明。可以歸結為爬蟲與用戶。

眾所周知,搜索引擎的索引庫是分層級的,優(yōu)質的網(wǎng)頁會被分配到重要索引庫,普通網(wǎng)頁會待在普通庫,再差一些的網(wǎng)頁會被分配到低級庫去當補充材料。目前60%的檢索需求只調用重要索引庫即可滿足,這也就解釋了為什么有些網(wǎng)站的收錄量超高流量卻一直不理想。

那么,哪些網(wǎng)頁可以進入優(yōu)質索引庫呢。其實總的原則就是一個:對用戶的價值。包括卻不僅于:

1,有時效性且有價值的頁面:在這里,時效性和價值是并列關系,缺一不可。有些站點為了產生時效性內容頁面做了大量采集工作,產生了一堆無價值面頁,也是百度不愿看到的.

2,內容優(yōu)質的專題頁面:專題頁面的內容不一定完全是原創(chuàng)的,即可以很好地把各方內容整合在一起,或者增加一些新鮮的內容,比如觀點和評論,給用戶更豐富全面的內容。

3,高價值原創(chuàng)內容頁面:百度把原創(chuàng)定義為花費一定成本、大量經驗積累提取后形成的文章。千萬不要再問我們偽原創(chuàng)是不是原創(chuàng)。

4,重要個人頁面:這里僅舉一個例子,科比在新浪微博開戶了,即使他不經常更新,但對于百度來說,它仍然是一個極重要的頁面。

9.網(wǎng)站標題是完全一致怎么優(yōu)化?

官方解答:最簡單的方式是每個頁面使用文章標題作為標題,并加上網(wǎng)站名稱。

百度官方解答集:為什么蜘蛛天天來,而快照不更新呢?

10.百度現(xiàn)在對URL中出現(xiàn)中文字符仍然不友好嗎?

官方解答:現(xiàn)在中文目錄或者url已經基本完美解決了,百度發(fā)表過聲明的,收錄時候會自動解析中文為編碼收錄的。

使用百度平臺閉站工具后仍有抓?。?/p>

官方解答:通過反饋中心來反饋

----------------------------------------------------

本文由營銷小能手整理

作者:任曉亮 QQ:541098712

營銷小能手公眾微信號:yx-xns 長按復制

    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內容均由用戶發(fā)布,不代表本站觀點。請注意甄別內容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內容,請點擊一鍵舉報。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多