巧用robots避免蜘蛛黑洞-百度站長平臺資訊

來源：未知日期：2017-06-27 | 分類：seo

　　對于百度搜索引擎來說，蜘蛛黑洞特指網(wǎng)站通過極低的成本制造出大量參數(shù)過多，及內(nèi)容雷同但具體參數(shù)不同的動態(tài)URL ，就像一個無限循環(huán)的“黑洞”將spider困住，Baiduspider浪費(fèi)了大量資源抓取的卻是無效網(wǎng)頁。

　　比如很多網(wǎng)站都有篩選功能，通過篩選功能產(chǎn)生的網(wǎng)頁經(jīng)常會被搜索引擎大量抓取，而這其中很大一部分檢索價(jià)值不高，如“500-1000之間價(jià)格的租房”，首先網(wǎng)站（包括現(xiàn)實(shí)中）上基本沒有相關(guān)資源，其次站內(nèi)用戶和搜索引擎用戶都沒有這種檢索習(xí)慣。這種網(wǎng)頁被搜索引擎大量抓取，只能是占用網(wǎng)站寶貴的抓取配額。那么該如何避免這種情況呢？西安網(wǎng)站建設(shè)推薦閱讀>>> 帶你玩轉(zhuǎn)robots協(xié)議，新手必備，

　　我們以北京某團(tuán)購網(wǎng)站為例，看看該網(wǎng)站是如何利用robots巧妙避免這種蜘蛛黑洞的：

　　對于普通的篩選結(jié)果頁，該網(wǎng)站選擇使用靜態(tài)鏈接，如：http://bj.XXXXX.com/category/zizhucan/weigongcun

　　同樣是條件篩選結(jié)果頁，當(dāng)用戶選擇不同排序條件后，會生成帶有不同參數(shù)的動態(tài)鏈接，而且即使是同一種排序條件（如：都是按銷量降序排列），生成的參數(shù)也都是不同的。如：http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek

　　http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

　　對于該團(tuán)購網(wǎng)來說，只讓搜索引擎抓取篩選結(jié)果頁就可以了，而各種帶參數(shù)的結(jié)果排序頁面則通過robots規(guī)則拒絕提供給搜索引擎。

　　robots.txt的文件用法中有這樣一條規(guī)則：Disallow: /*?* ，即禁止搜索引擎訪問網(wǎng)站中所有的動態(tài)頁面。該網(wǎng)站恰是通過這種方式，對Baiduspider優(yōu)先展示高質(zhì)量頁面、屏蔽了低質(zhì)量頁面，為Baiduspider提供了更友好的網(wǎng)站結(jié)構(gòu)，避免了黑洞的形成。

相關(guān)文章：

利用robots.txt禁止百度蜘蛛Baidusppider抓取

User-agent: * Disallow: / Allow: /complain/ Allow: /media_partners/ Allow: /about/ Allow: /user_agreement/ User-agent: ByteSpider Allow: / User-agent: ToutiaoSpider Allow: / 以上是今日頭條的robots.txt，禁止所有搜索引擎收錄，同時(shí)又...
【官方說法】robots文件是否支持中文目錄

有同學(xué)問百度站長學(xué)院一個關(guān)于robots的問題：我們有個站點(diǎn)的目錄結(jié)構(gòu)使用的是中文，這樣式兒的：www.a.com/冒險(xiǎn)島/123.html，那在制作robots文件和sitemap文件的時(shí)候，可以直接使用中文嗎？百度能...
網(wǎng)站誤封Robots該如何處理

robots文件是搜索生態(tài)中很重要的一個環(huán)節(jié)，同時(shí)也是一個很細(xì)節(jié)的環(huán)節(jié)。很多站長同學(xué)在網(wǎng)站運(yùn)營過程中，很容易忽視r(shí)obots文件的存在，進(jìn)行錯誤覆蓋或者全部封禁robots，造成不必要損失！那...
禁止百度圖片搜索收錄某些圖片的方法

目前百度圖片搜索也使用了與百度網(wǎng)頁搜索相同的spider，如果想禁止Baiduspider抓取網(wǎng)站上所有圖片、禁止或允許Baiduspider抓取網(wǎng)站上的某種特定格式的圖片文件可以通過設(shè)置robots實(shí)現(xiàn)：西安廣告...
使用robots巧妙避免蜘蛛黑洞

對于百度搜索引擎來說，蜘蛛黑洞特指網(wǎng)站通過極低的成本制造出大量參數(shù)過多、內(nèi)容類同但url不同的動態(tài)URL ，就像一個無限循環(huán)的黑洞，將spider困住。spider浪費(fèi)了大量資源抓取的卻是無效網(wǎng)...
robots.txt寫法_怎么寫robots

robots是站點(diǎn)與spider溝通的重要渠道，站點(diǎn)通過robots文件聲明該網(wǎng)站中不想被搜索引擎收錄的部分或者指定搜索引擎只收錄特定的部分。請注意，僅當(dāng)您的網(wǎng)站包含不希望被搜索引擎收錄的內(nèi)容...
百度站長平臺robots工具升級公告

親愛的網(wǎng)站管理員，很高興的告訴大家，百度站長平臺 robots 工具全新升級，升級后能夠?qū)崟r(shí)查看網(wǎng)站在百度中已生效的的robots文件，并支持對robots進(jìn)行語法及邏輯校驗(yàn)，有助于站長更清晰的...
怎樣寫robots文件_robots文件寫法技巧_robot.txt的例子

資料一 1.robots.txt文件是什么 robots.txt是一個純文本文件，是搜索引擎中訪問網(wǎng)站的時(shí)候要查看的第一個文件。robots.txt文件告訴蜘蛛程序在服務(wù)器上什么文件是可以被查看的。每個站點(diǎn)最好建立...
robots.txt文件的格式

robots.txt文件包含一條或更多的記錄，這些記錄通過空行分開（以CR,CR/NL, or NL作為結(jié)束符），每一條記錄的格式如下所示： field:optional spacevalueoptionalspace 在該文件中可以使用#進(jìn)行注解，具體使...
robots.txt文件是什么？

搜索引擎通過一種程序robot（又稱spider），自動訪問互聯(lián)網(wǎng)上的網(wǎng)頁并獲取網(wǎng)頁信息。您可以在您的網(wǎng)站中創(chuàng)建一個純文本文件robots.txt，在這個文件中聲明該網(wǎng)站中不想被robot 訪問的部分，這...

上一篇：淺談URL優(yōu)化與重要性
下一篇：網(wǎng)址規(guī)范化優(yōu)化全面大解析

亚洲欧美成人综合一区_国产精品一区二区无码_亚洲风情偷拍区_成?人免费无码视频在线看

巧用robots避免蜘蛛黑洞-百度站長平臺資訊