如何制作對應(yīng)關(guān)系sitemap文件
通過XML文件描述url級別的PC頁與手機(jī)頁的對應(yīng)關(guān)系,網(wǎng)站當(dāng)前有對應(yīng)關(guān)系的所有PC頁面url均需要給出。(xml格式sitemap的基礎(chǔ)制作方法可點(diǎn)擊了解)
具體的對應(yīng)關(guān)系sitemap(url級別)格式如下:
<?xml version="1.0"encoding="UTF-8"?>
<urlset>
<url>
<!--必填標(biāo)簽,表示PC頁的url地址 -->
<loc><![CDATA[http://www.yoursite.html/yoursite.html]]></loc>
<data>
<display>
<!—可選標(biāo)簽,表示該P(yáng)C頁對應(yīng)的html5版式的手機(jī)頁的url地址 -->
<html5_url><![CDATA[http://html5.yoursite.html/yoursite.html]]></html5_url>
<!—可選標(biāo)簽,表示該P(yáng)C頁對應(yīng)的wml版式的手機(jī)頁的url地址 -->
<wml_url><![CDATA[http://wml.yoursite.html/yoursite.html]]></wml_url>
<!—可選標(biāo)簽,表示該P(yáng)C頁對應(yīng)的xhtml版式的手機(jī)頁的url地址 -->
<xhtml_url><![CDATA[http://xhtml.yoursite.html/yoursite.html]]></xhtml_url>
</display>
</data>
</url>
</urlset>
例如:
<?xmlversion="1.0" encoding="UTF-8"?>
<urlset>
<url>
<loc><![CDATA[http://www.sina.com.cn/]]></loc>
<data>
<display>
<html5_url><![CDATA[http://html5.sina.com.cn/]]></html5_url>
<wml_url><![CDATA[http://wml.sina.com.cn/]]></wml_url>
<xhtml_url><![CDATA[http://3g.sina.com.cn/]]></xhtml_url>
</display>
</data>
</url>
<url>
<loc><![CDATA[http://www.sohu.com/]]></loc>
<data>
<display>
<html5_url><![CDATA[http://html5.sohu.com/]]></html5_url>
<wml_url><![CDATA[http://wml.sohu.com/]]></wml_url>
<xhtml_url><![CDATA[http://3g.sohu.com/]]></xhtml_url>
</display>
</data>
</url>
</urlset>
如何制作對應(yīng)關(guān)系sitemap文件(pattern級別)?
1、格式
Pattern級別對應(yīng)關(guān)系提交支持XML sitemap的形式,每個xml sitemap文件可包含1組或者多組pattern對應(yīng)關(guān)系。格式說明如下:西安專業(yè)做網(wǎng)站公司,公司網(wǎng)頁制作推薦閱讀>>> 百度開啟“輕舟”計劃 免費(fèi)快速架設(shè)移動站點(diǎn),
示例: 各URL字段可以被CDATA標(biāo)記包含,如<![CDATA[url]]> 。
<?xml version="1.0"encoding="UTF-8"?>
<urlset>
<!-- 表示news.163.com下的一組pattern對應(yīng)關(guān)系-->
<url>
<loc><![CDATA[http://news.163.com/]]></loc>
<data>
<display>
<pc_url_pattern><![CDATA[http://news.163.com/(\d+)/(\d+)/(\d+)/(\w+).html]]></pc_url_pattern>
<xhtml_url_pattern ><![CDATA[http://3g.163.com/news/${1}/${2}/${3}/${4}.html]]></xhtml_url_pattern>
<wml_url_pattern ><![CDATA[http://wap.163.com/wml/page/ntes/${1}/${2}/${3}/${4}.wml]]></wml_url_pattern>
</display>
</data>
</url>
2、字段詳細(xì)說明
pc_url_pattern: 表示PC頁pattern,在PC頁url的基礎(chǔ)上,首先確定url中哪些路徑或參數(shù)是可替換的。然后根據(jù)其類型,使用正則匹配符號(\d+)或者(\w+)表示該路徑或參數(shù)。(\d+)表示純數(shù)字字符串,(\w+)表示數(shù)字或字母組成的字符串。
xhtml_url_pattern / html5_url_pattern/ wml_url_pattern:表示xhtml/html5/wml版式的手機(jī)頁pattern,在手機(jī)頁url的基礎(chǔ)上,根據(jù)可替換參數(shù)在對應(yīng)的PC頁pattern中出現(xiàn)的順序,依次用${1},${2},……表示該參數(shù)。
3、舉例
以網(wǎng)易的新聞頁“漫游接電話移動也不要錢了”為例,其PC頁url地址為http://news.163.com/09/1001/07/5KH8DE1F000120GR.html, 其對應(yīng)的xhtml格式的手機(jī)頁url地址為http://3g.163.com/news/09/1001/07/5KH8DE1F000120GR.html。
步驟一:確定PC頁中的可替換參數(shù)或者路徑,得到其位置序號和類型。
根據(jù)網(wǎng)站自身url的層次結(jié)構(gòu),其中09,1001,07和5KH8DE1F000120GR為動態(tài)可替換的路徑。除5KH8DE1F000120GR為字母和數(shù)字混合外,其余均為純數(shù)字。西安網(wǎng)站制作公司 那家好,西安建站推薦閱讀>>> 百度要革自己的命移動搜索或取消PC網(wǎng)頁收錄,
步驟二:根據(jù)可替換參數(shù)或路徑的類型,得到PC頁pattern (即sitemap中的pc_url_pattern)。
使用正則匹配符號(\d+)或者(\w+)表示該路徑或參數(shù)。(\d+)表示純數(shù)字字符串,(\w+)表示數(shù)字或字母組成的字符串。
步驟三:根據(jù)手機(jī)頁url,以及可替換參數(shù)在步驟一中的位置序號,依次用${1},${2},……表示替換掉手機(jī)頁url中的可替換參數(shù)或路徑,得到手機(jī)頁pattern。
例子中,依次用${1},${2},${3}和${4}替換掉09,1001,07和5KH8DE1F000120GR,得到手機(jī)頁pattern為http://3g.163.com/news/${1}/${2}/${3}/${4}.html。
步驟四:根據(jù)手機(jī)頁的頁面類型,將手機(jī)頁pattern寫入對應(yīng)的字段。各字段可以用CDATA標(biāo)記包含,如<![CDATA[url]]> 。
如示例中該pattern的手機(jī)頁面為xhtml版式,將pattern http://3g.163.com/news/${1}/${2}/${3}/${4}.html 寫入到xhtml_url_pattern字段中。
最終得到sitemap文件如下:
<?xml version="1.0"encoding="UTF-8"?>
<urlset>
<!—表示news.163.com下的一組pattern對應(yīng)關(guān)系-->
<url>
<loc><![CDATA[http://news.163.com/]]></loc>
<data>
<display>
<pc_url_pattern><![CDATA[http://news.163.com/(\d+)/(\d+)/(\d+)/(\w+).html]]></pc_url_pattern>
<xhtml_url_pattern ><![CDATA[http://3g.163.com/news/${1}/${2}/${3}/${4}.html]]></xhtml_url_pattern>
<!-- 一組PC pattern可能含有多個版式的手機(jī)頁pattern -->
</display>
</data>
</url>
<!-- 下一組pattern放在一個新的url節(jié)點(diǎn)內(nèi) -->
</urlset>
備注
· 通過sitemap只能提交具有簡單對應(yīng)關(guān)系的pattern,也即,在PC頁url與手機(jī)頁路徑或參數(shù)之間存在直接的對應(yīng)關(guān)系,使得機(jī)器能根據(jù)PC頁url按照一定的正則pattern自動計算出與其對應(yīng)的手機(jī)頁的url。如http://news.sina.com.cn/c/2012-05-27/235824487992.shtml和http://news.sina.cn/?sa=t124v71d6155414&pos=102&vt=4雖然是對應(yīng)的,但是從url本身很難找到聯(lián)系,就不屬于簡單對應(yīng)關(guān)系。
· 正則匹配符號只支持(\d+)和(\w+),且不可嵌套使用,如(d+(\w+))這種形式不合法。域名中不可出現(xiàn)正則匹配符號。
· pattern中,站長無需對特殊字符進(jìn)行轉(zhuǎn)義,例如不需要用\.代替. ,不需要用&代替&。
· pattern級別對應(yīng)關(guān)系和url級別對應(yīng)關(guān)系的sitemap格式不一樣,請分別制作不同的文件并分開提交。
相關(guān)文章:
-
隨著人們將越來越多的時間放在手機(jī)上,以前只在電腦上才能完成的購物、聊天、信息獲取等行為越來越傾向于移動手機(jī)上了。手機(jī)網(wǎng)民的增多,巨大的流量又會形成倒逼壓力,讓之前不關(guān)注...
-
親愛的網(wǎng)站管理員: 秉承用戶至上的原則,百度移動搜索不斷更新系統(tǒng)、升級算法,一切都為了讓用戶擁有更順暢的搜索體驗(yàn)。百度移動搜索冰桶算法近期將升級至2.0版本。 2.0版本將嚴(yán)厲打擊...
-
親愛的網(wǎng)站管理員: 秉承用戶至上的原則,百度移動搜索不斷更新系統(tǒng)、升級算法,一切都為了讓用戶擁有更順暢的搜索體驗(yàn)。百度移動搜索冰桶算法近期將升級至3.0版本。3.0版本將嚴(yán)厲打擊...
-
親愛的站長朋友們: 大家好!前段時間跟大家分享了關(guān)于百度移動搜索冰桶算法的情況,一期上線該算法后,我們發(fā)現(xiàn)大部分相關(guān)站點(diǎn)已經(jīng)進(jìn)行了調(diào)整,強(qiáng)制用戶下載或全屏彈窗的情況得到了...
-
百度對站點(diǎn)的收錄不理想,導(dǎo)致站內(nèi)搜索結(jié)果數(shù)太少? 收錄不及時,導(dǎo)致最新的頁面搜不到? 您可以在結(jié)果頁管理的提升收錄效果功能中提交數(shù)據(jù),從而提升您的站內(nèi)搜索收錄時效性和覆蓋率...
-
下面介紹一些有關(guān)標(biāo)記的例子及解釋。 一、meta 標(biāo)簽分兩大部分:HTTP 標(biāo)題信息(http-equiv)和頁面描述信息(name)。 1、http-equiv 屬性的 Content-Type 值(顯示字符集的設(shè)定) 說明:設(shè)定頁面使用...
-
百度轉(zhuǎn)碼聲明中提到3個禁止百度轉(zhuǎn)碼的方法,對WordPress主題而言,最簡單的就是在header.php文件中head/head標(biāo)簽內(nèi)增加下面的一段代碼: meta http-equiv=Cache-Control content=no-transform / 注:之前的 meta...
-
隨著移動設(shè)備不斷的普及,人們正式步入了移動時代,那么作為一枚為互聯(lián)網(wǎng)提供內(nèi)容的站長朋友,如何保證自己和自己的網(wǎng)站在移動化來襲之時不被時代拋棄,不被我們的用戶拋棄呢? 今天...
-
1月21日百度站長平臺微信公眾帳號推出了有獎問答活動,將近400名同學(xué)完整地做完了8道與《百度搜索Mobile Friendly(移動友好度)標(biāo)準(zhǔn)V1.0》有關(guān)的選擇題,但是完全答對的人并不多哦!今天學(xué)院...
-
百度搜索是全球最大的中文搜索引擎。在移動互聯(lián)時代,百度每天響應(yīng)移動搜索請求高達(dá)幾十億次,導(dǎo)向互聯(lián)網(wǎng)的流量幾十億量級,且快速增長。面對移動用戶的迅猛崛起,站長們紛紛涌入移...