sitemap加強版神器:Etag
sitemap大家非常熟悉,但是如何更好利用sitemap,百度建議您開啟Etag?,F(xiàn)在我們就來講講Etag:
Etag簡介
Etag(Entity Tags)是URL的tag,用來標(biāo)示URL對象是否改變,這樣可利用客戶端(例如瀏覽器)的緩存。由服務(wù)器首先產(chǎn)生Etag,客戶端通過將該記號傳回服務(wù)器要求服務(wù)器驗證其(客戶端)緩存。服務(wù)器使用它來判斷頁面是否已經(jīng)被修改,如果未修改返回304,而不必重新傳輸整個對象。
sitemap現(xiàn)存弊端
1.發(fā)現(xiàn)更新不及時
當(dāng)站點或其sitemap發(fā)生更新時,百度難以及時發(fā)現(xiàn)并響應(yīng),因為百度難以無時無刻地持續(xù)檢查站點內(nèi)容和sitemap是否更新。
2.全量抓取,消耗帶寬
現(xiàn)在百度對站點sitemap的抓取會將sitemap文件完整下載下來,鑒于sitemap文件一般較大,而這種下載可能存在多次,故比較消耗網(wǎng)站的流量和帶寬。站點啟用Etag的好處 1.對sitemap啟用ETag后,百度可以更快速地響應(yīng)sitemap的更新,沒有更改內(nèi)容的情況下,服務(wù)器只發(fā)回304應(yīng)答頭,對流量的消耗極小,在每個head平均227B大小的通常情形下,一整天24小時每秒都回應(yīng)的流量消耗僅為18.7M。
2.現(xiàn)在站長平臺對每個站點的sitemap主動抓取次數(shù)設(shè)有上限,且這項功能沒有對所有站開放,如果您的站點sitemap啟用了ETag,并通過了測試,那么就可以用很小的流量享受百度及時更新您的sitemap的功能,以便于百度更好地收錄您網(wǎng)站的內(nèi)容。Etag的作用 HTTP1.1用Etag來判斷請求的文件是否被修改,主要為了解決Last-Modified無法解決的一些問題:西安建網(wǎng)站公司,做網(wǎng)站推薦閱讀>>> 百度sitemap權(quán)限即將全面開放(附制作教程),
1、一些文件也許會周期性的更改,但是他的內(nèi)容并不改變(僅僅改變的修改時間),這個時候并不希望客戶端認(rèn)為這個文件被修改了重新GET;
2、某些文件修改非常頻繁, 1秒內(nèi)修改了N次,If-Modified-Since能檢查到的粒度是秒級的,這種修改無法判斷;西安 手機網(wǎng)站建設(shè),做網(wǎng)站推薦閱讀>>> 搜索引擎提交sitemap大全(網(wǎng)站地圖),
3、某些服務(wù)器不能精確的得到文件的最后修改時間。
為此,HTTP1.1引入了Etag. 但標(biāo)準(zhǔn)并沒有規(guī)定Etag的內(nèi)容是什么或者說要怎么實現(xiàn),唯一規(guī)定的是Etag需要放在雙引號內(nèi)。Etag由服務(wù)器端生成,客戶端通過If-Match或者說If-None-Match這個條件判斷請求來驗證資源是否修改。我們常見的是使用If-None-Match.請求一個文件的流程可能如下:
第一次請求:
1.客戶端發(fā)起HTTP GET請求一個文件;
2.服務(wù)器處理請求,返回文件內(nèi)容和一堆Header,當(dāng)然包括Etag(例如"1ec5-502264e2ae4c0")(假設(shè)服務(wù)器支持Etag生成和已經(jīng)開啟了Etag). 狀態(tài)碼200,如下圖所示,首次請求百度首頁時,成功得到百度logo圖片文件bd_logo1.png,狀態(tài)碼200,大小8.1KB,返回的Header中包括Etag(“1ec5-502264e2ae4c0”)。
第二次請求:
1.客戶端發(fā)起HTTP GET請求一個文件,這個時候客戶端同時發(fā)送一個If-None-Match頭,這個頭的內(nèi)容就是我們第一次請求時服務(wù)器返回的Etag:1ec5-502264e2ae4c0;
2.服務(wù)器判斷發(fā)送過來的Etag和計算出來的Etag是匹配的,不返回200,返回304,讓客戶端繼續(xù)使用本地緩存。如圖所示這次對bd_logo1.png的請求,服務(wù)器只返回了Header沒有返回內(nèi)容,大小僅為349B。西安網(wǎng)站建設(shè)費用,企業(yè)網(wǎng)站設(shè)計推薦閱讀>>> Sitemap詳細介紹,
相關(guān)文章:
-
隨著人們將越來越多的時間放在手機上,以前只在電腦上才能完成的購物、聊天、信息獲取等行為越來越傾向于移動手機上了。手機網(wǎng)民的增多,巨大的流量又會形成倒逼壓力,讓之前不關(guān)注...
-
百度對站點的收錄不理想,導(dǎo)致站內(nèi)搜索結(jié)果數(shù)太少? 收錄不及時,導(dǎo)致最新的頁面搜不到? 您可以在結(jié)果頁管理的提升收錄效果功能中提交數(shù)據(jù),從而提升您的站內(nèi)搜索收錄時效性和覆蓋率...
-
通過XML文件描述url級別的PC頁與手機頁的對應(yīng)關(guān)系,網(wǎng)站當(dāng)前有對應(yīng)關(guān)系的所有PC頁面url均需要給出。(xml格式sitemap的基礎(chǔ)制作方法可 點擊了解 ) 具體的對應(yīng)關(guān)系sitemap(url級別)格式如下:...
-
據(jù)站長之家獲悉,百度將全面開放sitemap權(quán)限。從sitemap上線以來,其權(quán)限一直處于捉襟見肘狀態(tài),若網(wǎng)站開通sitemap權(quán)限,則可提交該主域下所有子域的網(wǎng)站數(shù)據(jù),有利于網(wǎng)站內(nèi)容的快速收錄。...
-
各位親愛的管理員: 為了更好地順應(yīng)時代潮流,完善對移動站點的處理,使百度與站長之間的溝通更加順暢,百度技術(shù)部門對PC移動化方式進行了概念上的規(guī)范,分別將目前主流的三種PC站移動...
-
一、什么是Sitemap? Sitemap(即站點地圖)就是您網(wǎng)站上各網(wǎng)頁的列表。創(chuàng)建并提交Sitemap有助于百度發(fā)現(xiàn)并了解您網(wǎng)站上的所有網(wǎng)頁。您還可以使用Sitemap提供有關(guān)您網(wǎng)站的其他信息,如上次更新...
-
一、Sitemap介紹 1、什么是Sitemap 1)Sitemap協(xié)議 定義:Sitemap簡稱網(wǎng)站地圖,就是網(wǎng)站上的網(wǎng)頁列表 作用:通過Sitemap告訴蜘蛛站點中哪些網(wǎng)頁可供抓取 格式:分為三種格式:txt文本格式、xml格式...
-
親愛的網(wǎng)站管理員, 很高興的通知你,百度站長平臺sitemap工具全新升級并開啟內(nèi)測,升級后支持移動站頁面的提交和收錄,現(xiàn)在開啟內(nèi)測,歡迎廣大站長參與內(nèi)測,提出更多寶貴的建議。西安...
-
1、xml格式的Sitemap文件 樣例: locwww.example1.com/loc該頁的網(wǎng)址。該值必須少于256個字節(jié)(必填項)。格式為loc您的url地址/loc lastmod2010-01-01/lastmod該文件上次修改的日期(選填項)。格式為lastmod年-月-日...
-
Sitemap可以給站長帶來什么 百度搜索引擎會使用Sitemap中的數(shù)據(jù)來了解網(wǎng)站的結(jié)構(gòu)等信息,熟悉網(wǎng)站后可以更好抓取。西安微網(wǎng)站制作,建企業(yè)網(wǎng)站推薦閱讀 seoer必備常用站長工具 , 百度對已提交...