溫州seo【Baiduspider抓取異常原因】百度搜索引擎工作原理五

- 百度官方教程+馬慧SEO編輯 - 閱 561

溫州seo:百度搜索引擎工作原理系列轉自百度官方,不做任何過多注解。

今天,小小課堂網為大家帶來的是轉自百度官方《百度搜索引擎工作原理五:造成Baiduspider抓取異常的原因》。溫州seo希望對大家有所幫助。

溫州seo

一、簡述抓取異常

有一些網頁,內容優質,用戶也可以正常訪問,但是Baiduspider卻無法正常訪問并抓取,造成搜索結果覆蓋率缺失,對百度搜索引擎對站點都是一種損失,百度把這種情況叫“抓取異常”。對于大量內容無法正常抓取的網站,百度搜索引擎會認為網站存在用戶體驗上的缺陷,并降低對網站的評價,在抓取、索引、排序上都會受到一定程度的負面影響,最終影響到網站從百度獲取的流量。

二、抓取異常原因

下面向站長介紹一些常見的抓取異常原因:

1,服務器連接異常

服務器連接異常會有兩種情況:一種是站點不穩定,Baiduspider嘗試連接您網站的服務器時出現暫時無法連接的情況;一種是Baiduspider一直無法連接上您網站的服務器。

造成服務器連接異常的原因通常是您的網站服務器過大,超負荷運轉。也有可能是您的網站運行不正常,請檢查網站的web服務器(如apacheiis)是否安裝且正常運行,并使用瀏覽器檢查主要頁面能否正常訪問。您的網站和主機還可能阻止了Baiduspider的訪問,您需要檢查網站和主機的防火墻。

2,網絡運營商異常

網絡運營商分電信和聯通兩種,Baiduspider通過電信或網通無法訪問您的網站。如果出現這種情況,您需要與網絡服務運營商進行聯系,或者購買擁有雙線服務的空間或者購買cdn服務。

3DNS異常

Baiduspider無法解析您網站的IP時,會出現DNS異常。可能是您的網站IP地址錯誤,或者域名服務商把Baiduspider封禁。請使用WHOIS或者host查詢自己網站IP地址是否正確且可解析,如果不正確或無法解析,請與域名注冊商聯系,更新您的IP地址。

4IP封禁

IP封禁為:限制網絡的出口IP地址,禁止該IP段的使用者進行內容訪問,在這里特指封禁了BaiduspiderIP。當您的網站不希望Baiduspider訪問時,才需要該設置,如果您希望Baiduspider訪問您的網站,請檢查相關設置中是否誤添加了BaiduspiderIP。也有可能是您網站所在的空間服務商把百度IP進行了封禁,這時您需要聯系服務商更改設置。

5UA封禁

UA即為用戶代理(User-Agent),服務器通過UA識別訪問者的身份。當網站針對指定UA的訪問,返回異常頁面(如403500)或跳轉到其他頁面的情況,即為UA封禁。當您的網站不希望Baiduspider訪問時,才需要該設置,如果您希望Baiduspider訪問您的網站,useragent相關的設置中是否有Baiduspider UA,并及時修改。

6,死鏈

頁面已經無效,無法對用戶提供任何有價值信息的頁面就是死鏈接,包括協議死鏈和內容死鏈兩種形式:

協議死鏈:頁面的TCP協議狀態/HTTP協議狀態明確表示的死鏈,常見的如404403503狀態等。

內容死鏈:服務器返回狀態是正常的,但內容已經變更為不存在、已刪除或需要權限等與原內容無關的信息頁面。

對于死鏈,我們建議站點使用協議死鏈,并通過百度站長平臺死鏈工具向百度提交,以便百度更快地發現死鏈,減少死鏈對用戶以及搜索引擎造成的負面影響。(溫州seo建議日常用xenu檢查全站死鏈情況)

7,異常跳轉

將網絡請求重新指向其他位置即為跳轉。異常跳轉指的是以下幾種情況:

1)當前該頁面為無效頁面(內容已刪除、死鏈等),直接跳轉到前一目錄或者首頁,百度建議站長將該無效頁面的入口超鏈接刪除掉。

2)跳轉到出錯或者無效頁面。

注意:對于長時間跳轉到其他域名的情況,如網站更換域名,百度建議使用301跳轉協議進行設置。(溫州seo建議301狀態永久保持)

8,其他異常

1)針對百度refer的異常:網頁針對來自百度的refer返回不同于正常內容的行為。

2)針對百度ua的異常:網頁對百度UA返回不同于頁面原內容的行為。

3JS跳轉異常:網頁加載了百度無法識別的JS跳轉代碼,使得用戶通過搜索結果進入頁面后發生了跳轉的情況。

4)壓力過大引起的偶然封禁:百度會根據站點的規模、訪問量等信息,自動設定一個合理的抓取壓力。但是在異常情況下,如壓力控制失常時,服務器會根據自身負荷進行保護性的偶然封禁。這種情況下,請在返回碼中返回503(其含義是“Service Unavailable),這樣Baiduspider會過段時間再來嘗試抓取這個鏈接,如果網站已空閑,則會被成功抓取。

以上就是小小課堂網為大家帶來的是轉自百度官方《百度搜索引擎工作原理五:造成Baiduspider抓取異常的原因》。溫州seo感謝您的觀看。優化培訓認準小小課堂!

非特殊說明,本文為小小課堂SEO自學網原創,歡迎轉載并保留版權 http://www.ryeyss.live/

本站提供SEO培訓、咨詢、診斷,微信(電話):13722793092 微信公眾號:xxktorg

ad              網站目錄

一條回應:“溫州seo【Baiduspider抓取異常原因】百度搜索引擎工作原理五”

  1. 馬慧SEO說道:

    小小課堂SEO自學網(http://www.ryeyss.live/ ),全網營銷SEO概念提出者,提供SEO培訓、全站優化診斷、顧問咨詢為主的SEO服務。分享SEO實戰經驗,新站快速排名,單頁面排名和三方平臺推廣等技術。電子書營銷、論壇發帖推廣、電子郵件營銷、新媒體運營等網絡營銷教程。

發表評論

電子郵件地址不會被公開。 必填項已用*標注

相關文章!
  • 百度降權網站 2018百度降權網站知多少
    - 閱 287

    網站只要不被懲罰,一般就說明采取的優化手段較為正常。 今天,小小課堂SEO自學網帶來的是《2018百度降權網站 […]

  • 百度算法 2018百度算法總結
    - 閱 336

    2018年,百度搜索大半年時間重點扶持了熊掌號,目前重點扶持自家的百家號,個人認為熊掌號可以看錯為算法或者工具 […]

  • 百度robots協議 百度robots協議
    - 閱 305

    Robots是站點與spider溝通的重要渠道,站點通過robots文件聲明本網站中不想被搜索引擎收錄的部分或 […]

昨天湖北快三开奖号