|
聲明:以下均來自百度官方及相關人員的解答。 1.為什么蜘蛛天天來,而快照不更新呢? 官方解答:蜘蛛天天來,你需要看蜘蛛是否只爬不抓,如果只爬不抓說明內容還是存在問題的,要加大原創(chuàng)力度,或者說蜘蛛是否很難抓取,另外蜘蛛來了也抓取了也不會很快就更新,這之間是有一個過程的,蜘蛛需要對抓取的內容進行判斷,并且快照也有一個緩存時間。一般情況下我們需要注意: 1、網(wǎng)站是否被降權,要是網(wǎng)站被降權了,要是網(wǎng)站被降權了,在搜索引擎那里屬于審核期,網(wǎng)站快照更新慢或不更新是很正常的。 2、網(wǎng)站是否被掛黑鏈,被掛大量黑鏈的網(wǎng)站也經常會快照不更新,需要定期查看網(wǎng)站是否被掛黑鏈。 3、網(wǎng)站速度問題,網(wǎng)站的加載速度會影響蜘蛛的正常抓取,一般情況下網(wǎng)站都是從上往下的加載,而有的時候由于速度因素導致網(wǎng)站只加載了頭部,后面部分而沒有及時顯示出來,也可能導致蜘蛛只抓取了頭部部分內容,而由于一般網(wǎng)站的頭部都是相同的,也就容易出現(xiàn)了抓取返回沒更新的狀態(tài)碼。 4、網(wǎng)站內容問題 網(wǎng)站內容長期采集或是偽原創(chuàng)也能導致蜘蛛返回304狀態(tài)碼,因為網(wǎng)站內容采集或偽原創(chuàng)的確會降低網(wǎng)站質量,導致百度不收錄等情況,搜索蜘蛛也會認為網(wǎng)站內容不具備收錄的意義,那么也就不會抓取新的內容而返回沒有更新的狀態(tài)。 5、長時間不更新,頁面長時間沒有更新也會導致快照不更新的情況,你不是高權重網(wǎng)站,也沒有大量其他外部來源,如果又長時間不更新,那么很可能就不更新快照。 6、蜘蛛問題,蜘蛛天天來,那來的到底是些什么蜘蛛呢?不是所有的蜘蛛來網(wǎng)站都會更新的,降權也說不定,所以我們需要分析網(wǎng)站日志,了解搜索引擎蜘蛛。 7、網(wǎng)頁上有時間戳,然后時間戳代碼長期沒更新產生了快照異常。 8、百度問題,有的時候百度在更新之后會出現(xiàn)一些問題,導致失誤,所以可以到百度快照投訴進行申訴。 9、百度會篩選一個最合適的快照進行展現(xiàn),如果你的最新的索引快照不如之前的好,那么還是會展現(xiàn)之前的快照。 后來經過分析,發(fā)現(xiàn)是因為網(wǎng)頁上的時間戳問題,經過修改和更新后恢復正常。 2.新網(wǎng)站、老域名如何才能讓百度快速收錄? 官方解答:首先了解該域名之前的內容,排除老域名因內容原因被百度懲罰。然后觀察Baiduspider來訪軌跡,確定是否有蜘蛛進行抓取。再看一下網(wǎng)頁狀態(tài)碼返回是否符合預期。如果都沒有問題,可以嘗試通過url提交工具http://zhanzhang.baidu.com/sitesubmit/index申請百度抓取。 3.網(wǎng)站不做偽靜態(tài)對收錄有沒有影響? 官方解答:對于不復雜的動態(tài)url,百度都可以搞定。 4.偽原創(chuàng)內容對網(wǎng)站是否有壞處? 官方解答:視內容對用戶的價值,無價值的純粹的偽原創(chuàng)是會被打擊的。 5.我們的原創(chuàng)內容被XX網(wǎng)站采集,他們是新聞源,但我們不是,這種情況該怎么辦? 官方解答:百度傾向于收錄原創(chuàng)的新聞內容。 如果確實有此情況,可以向站長平臺的投訴反饋中心提交反饋。前提是你的網(wǎng)站不是因為被黑、軟文等低質內容被懲罰。 6.網(wǎng)站title關鍵詞順序,是否影響排名? 官方解答:不影響。 7.純文本鏈接和錨文本鏈接,效果方面有啥區(qū)別? 官方解答:純文本還是錨文本并不重要,重要的是是否出現(xiàn)在有相關度的頁面上,百度現(xiàn)在對外鏈的依賴上已經很少了,研究這個意義不大。 8. 如果收錄都被建入低層庫的話,怎么辦?如何提升上來呢? 官方解答:主要 問題在于內容質量。 好網(wǎng)頁:無論從網(wǎng)站結構、怎么利于爬蟲抓取,還是從用戶體驗,用戶需求方面回答的始終有非常多信息來說明。可以歸結為爬蟲與用戶。 眾所周知,搜索引擎的索引庫是分層級的,優(yōu)質的網(wǎng)頁會被分配到重要索引庫,普通網(wǎng)頁會待在普通庫,再差一些的網(wǎng)頁會被分配到低級庫去當補充材料。目前60%的檢索需求只調用重要索引庫即可滿足,這也就解釋了為什么有些網(wǎng)站的收錄量超高流量卻一直不理想。 那么,哪些網(wǎng)頁可以進入優(yōu)質索引庫呢。其實總的原則就是一個:對用戶的價值。包括卻不僅于: 1,有時效性且有價值的頁面:在這里,時效性和價值是并列關系,缺一不可。有些站點為了產生時效性內容頁面做了大量采集工作,產生了一堆無價值面頁,也是百度不愿看到的. 2,內容優(yōu)質的專題頁面:專題頁面的內容不一定完全是原創(chuàng)的,即可以很好地把各方內容整合在一起,或者增加一些新鮮的內容,比如觀點和評論,給用戶更豐富全面的內容。 3,高價值原創(chuàng)內容頁面:百度把原創(chuàng)定義為花費一定成本、大量經驗積累提取后形成的文章。千萬不要再問我們偽原創(chuàng)是不是原創(chuàng)。 4,重要個人頁面:這里僅舉一個例子,科比在新浪微博開戶了,即使他不經常更新,但對于百度來說,它仍然是一個極重要的頁面。 9.網(wǎng)站標題是完全一致怎么優(yōu)化? 官方解答:最簡單的方式是每個頁面使用文章標題作為標題,并加上網(wǎng)站名稱。 10.百度現(xiàn)在對URL中出現(xiàn)中文字符仍然不友好嗎? 官方解答:現(xiàn)在中文目錄或者url已經基本完美解決了,百度發(fā)表過聲明的,收錄時候會自動解析中文為編碼收錄的。 使用百度平臺閉站工具后仍有抓?。?/p> 官方解答:通過反饋中心來反饋 ---------------------------------------------------- 本文由營銷小能手整理 作者:任曉亮 QQ:541098712 營銷小能手公眾微信號:yx-xns 長按復制 |
|
|
來自: jmsxu > 《網(wǎng)絡》