
Meta robots標簽是頁面head部分標簽的一種,也是一種用于禁止搜索引擎索引頁面內容的指令。目前百度僅支持nofollow和noarchive
nofollow:禁止搜索引擎跟蹤本頁面上的鏈接
如果您不想搜索引擎追蹤此網頁上的鏈接,且不傳遞鏈接的權重,請將此元標記置入網頁的<HEAD> 部分:<meta name="robots" content="nofollow">
如果您不想百度追蹤某一條特定鏈接,百度還支持更精確的控制,請將此標記直接寫在某條鏈接上:<a href="signin.php" rel="nofollow">signin</a>
要允許其他搜索引擎跟蹤,但僅防止百度跟蹤您網頁的鏈接,請將此元標記置入網頁的<HEAD> 部分:<meta name="Baiduspider" content="nofollow">
noarchive:禁止搜索引擎在搜索結果中顯示網頁快照
要防止所有搜索引擎顯示您網站的快照,請將此元標記置入網頁的<HEAD>部分:<meta name="robots" content="noarchive">
要允許其他搜索引擎顯示快照,但僅防止百度顯示,請使用以下標記:<meta name="Baiduspider" content="noarchive">
注:此標記只是禁止百度顯示該網頁的快照,百度會繼續為網頁建索引,并在搜索結果中顯示網頁摘要。
禁止百度圖片搜索收錄某些圖片的方法
目前百度圖片搜索也使用了與百度網頁搜索相同的spider,如果想禁止Baiduspider抓取網站上所有圖片、禁止或允許Baiduspider抓取網站上的某種特定格式的圖片文件可以通過設置robots實現:
禁止Baiduspider抓取網站上所有圖片 | User-agent: Baiduspider |
僅允許Baiduspider抓取網頁和.gif格式圖片 其他格式圖片 | User-agent: Baiduspider |
僅禁止Baiduspider抓取.jpg格式圖片 | User-agent: Baiduspider |