如何批量檢測被百度收錄的死鏈的方法
前段時間服務(wù)器被入侵,掛了很多博彩之類的黑頁,而且全部被百度收錄。
現(xiàn)在把漏洞補好了,但刪除黑頁文件以后成了死鏈,要怎么讓百度刪除收錄呢?
在網(wǎng)上找了一下,似乎只有檢測網(wǎng)址是否被收錄的工具,而沒有檢測收錄的是不是死鏈的工具。
自己理清了下思路,找辦法找出了所有被收錄的死鏈,并寫下這篇文章。
不知道有沒有更好的方法,大家可以告訴我,先分享給大家,如果有大神請忽視或者告訴我更好的方法,一起學習交流吧。
下面教程開始
先在百度找到xenu可以模擬爬蟲爬取所有連接,我下載了個漢化版。
我們先用這個工具查詢所有被收錄的頁面。
打開軟件,填入簡版百度site網(wǎng)站地址,之所以用簡版是可以減少鏈接查詢時間和內(nèi)容。(請把xxx.bizcn.com換成你的網(wǎng)址)
http://www.baidu.com/s?ie=utf-8&tn=baidulocal&wd=site%3Axxx.bizcn.com
等待檢測完成。
點擊導出為制表符分隔的文件。
導出的文件,我們可以看到格式是:網(wǎng)址+空格+狀態(tài)碼
那么寫一個正則,把需要的網(wǎng)址提取出來就行,比如www.baidu.com下的404頁面就是
/http:\/\/www.baidu.com(.*?)\s404/i
(以http://www.baidu.com開頭,\s代表空格,404,/i代表匹配大小寫)
不會正則怎么辦?
為了方便大家,我把文件作了修改,大家只要把head改成標致性開頭,state改成狀態(tài)碼就行,file改成導出的文件路徑就行。西安網(wǎng)站建設(shè)推薦閱讀>>> 如何正確使用死鏈提交工具,
head怎么改,舉個例子,
你的網(wǎng)站是http://www.baidu.com/abc.html,那么你就寫http://www.baidu.com/
你的網(wǎng)站是http://abc.baidu.com/abc.html,那么你就寫http://abc.baidu.com/
把正則寫入php,在php環(huán)境下運行g(shù)et.php。那么結(jié)果就出來了。
這時你只需要全選,復制到一個txt文件,上傳到網(wǎng)站空間,再到百度站長平臺死鏈提交填入文件路徑就行就可以。
我們知道,思路是通過爬取找出所有被收錄的鏈接,然后按條件列出來而已。西安網(wǎng)站建設(shè)推薦閱讀>>> 死鏈的產(chǎn)生的原因_死鏈對網(wǎng)站seo的影,
這樣的話,只要把開頭輸入的site網(wǎng)址改一下,也可以查詢其他搜索引擎的收錄。
把正則改一下,可以獲得如標題等其他內(nèi)容。在此就不一一敘述。西安做網(wǎng)站推薦閱讀>>> 手把手教您制作死鏈列表文件,
相關(guān)文章:
-
在學習SEO的時候我們會接觸鏈接這個東西,在SEO界鏈接基本分為內(nèi)鏈、外鏈(友情鏈接也被稱為外鏈)、反鏈、死鏈四大類。那么,我為何要單獨闡述死鏈這個東西呢?因為死鏈是當內(nèi)鏈和外...
-
在網(wǎng)站日常運營,死鏈是難免會產(chǎn)生的,不僅影響了用戶體驗,也影響了搜索效果;針對這一現(xiàn)象,我們邀請了站長社區(qū)版主三木為大家分享死鏈處理心得。 本文主要講述死鏈對網(wǎng)站的影響;...
-
在第四次深度接觸結(jié)束后,spider工程師表示新浪的死鏈處理工作一直效果不錯,提醒學院應(yīng)該請其做個分享。新浪穩(wěn)座國家級門戶頭把交椅,誰還敢說自己網(wǎng)站結(jié)構(gòu)的復雜程度可以超越新浪。...
-
大量死鏈對搜索引擎來講,有什么影響? 1、幾乎很多站都避免不了存在死鏈接,但死鏈率過高,會影響搜索引擎對網(wǎng)站的評分。 2、搜索引擎對每個網(wǎng)站每天抓取的頻次是限額的,若網(wǎng)站存在大...
-
幾乎所有網(wǎng)站都會出現(xiàn)不再需要展現(xiàn)的網(wǎng)頁,如何處理這樣的網(wǎng)頁也成為站長經(jīng)常談?wù)摰脑掝}。為此,百度站長學院專訪了負責死鏈識別處理的工程師,了解到百度眼中的死鏈其實包括三種:...
-
上次說到如何正確設(shè)置死鏈,關(guān)鍵點在于http狀態(tài)碼一定要迅速返回,不要有延遲,那么接下來使用百度站長平臺提供的死鏈提交工具要注意什么呢? 昨天百度站長平臺又接到了反饋,站長說死...
-
在學習SEO的時候我們會接觸鏈接這個東西,在SEO界鏈接基本分為內(nèi)鏈、外鏈(友情鏈接也被稱為外鏈)、反鏈、死鏈四大類。那么,我為何要單獨闡述死鏈這個東西呢?因為死鏈是當內(nèi)鏈和外...
-
最近頻繁接到某站長反饋:已對自己論壇的垃圾帖做死鏈處理、并已使用百度站長平臺提供的死鏈提交工具,但相關(guān)鏈接依然未得到處理。經(jīng)百度站長平臺追查,發(fā)現(xiàn)該站長提供的所謂死鏈并...
-
第一步,處理網(wǎng)站已存在的死鏈,制作死鏈文件篩查網(wǎng)站內(nèi)部存在的死鏈,并將這些死鏈頁面設(shè)置成為404頁面,即百度訪問它們時返回404代碼。將需提交的死鏈列表制作成一個死鏈文件,制作...
-
一、死鏈介紹 1、什么是死鏈 頁面已經(jīng)無效,無法對用戶提供任何有價值信息的頁面就是死鏈接,包括協(xié)議死鏈和內(nèi)容死鏈兩種形式。 協(xié)議死鏈:頁面的TCP協(xié)議狀態(tài)/HTTP協(xié)議狀態(tài)明確表示的死...