国内自拍偷拍-国内自拍网-国内自拍网站-国内自拍小视频-亚洲高清中文字幕-亚洲高清中文字幕一区二区三区

好健康網-中國醫療健康行業服務平臺! VIP快審
首頁 新聞資訊 科技網絡

robot.txt寫法 robots文件怎么寫 robots文件寫法技巧

時間:2016-05-14 15:33 來源:未知 作者:ADMIN 人氣:
【導讀】:資料一 1.robots.txt文件是什么 robots.txt是一個純文本文件,是搜索引擎中訪問網站的時候要查看的第一個文件。robots.txt文件告訴蜘蛛程序在服務器上什么文件是可以被查看的。每...
資料一
 
1.robots.txt文件是什么
 
robots.txt是一個純文本文件,是搜索引擎中訪問網站的時候要查看的第一個文件。robots.txt文件告訴蜘蛛程序在服務器上什么文件是可以被查看的。每個站點最好建立一個robots.txt文件,對seo更友好。每當搜索蜘蛛來尋找并不存在的robots.txt文件時,服務器將在日志中記錄一條404錯誤,所以你應該在網站中添加一個robots.txt(即使這個robots.txt文件只是一個空文件)。
 
2.robots.txt的寫法(語法)
 
1)User-agent: 該項的值用于描述搜索引擎蜘蛛的名字。如果該項的值設為*,則該協議對任何機器人均有效。
 
2)Disallow: 該項的值用于描述不希望被訪問到的一個URL,一個目錄或者整個網站。以Disallow 開頭的URL 均不會被搜索引擎蜘蛛訪問到。任何一條Disallow 記錄為空,說明該網站的所有部分都允許被訪問。
 
3)用法舉例:
 
網站目錄下所有文件均能被所有搜索引擎蜘蛛訪問
 
User-agent: *
 
Disallow:
 
禁止所有搜索引擎蜘蛛訪問網站的任何部分
 
User-agent: *
 
Disallow: /
 
禁止所有的搜索引擎蜘蛛訪問網站的幾個目錄
 
User-agent: *
 
Disallow: /a/
 
Disallow: /b/
 
禁止搜索引擎蜘蛛訪問目錄a和目錄b
 
只允許某個搜索引擎蜘蛛訪問
 
User-agent: Googlebot
 
Disallow:
 
您應該限制網站某些文件不被蜘蛛抓取。
 
一般網站中不需要蜘蛛抓取的文件有:后臺管理文件、程序腳本、附件、數據庫文件、編碼文件、樣式表文件、模板文件、導航圖片和背景圖片等等。
 
3.robots.txt文件帶來的風險以及解決
 
robots.txt 同時也帶來了一定的風險:其也給攻擊者指明了網站的目錄結構和私密數據所在的位置。設置訪問權限,對您的隱私內容實施密碼保護,這樣,攻擊者便無從進入。
 
4.常見搜索引擎蜘蛛Robots名字
 
Baiduspider :http://www.baidu.com
 
Scooter :http://www.altavista.com
 
ia_archiver: http://www.alexa.com
 
Googlebot :http://www.google.com
 
Inktomi Slurp :http://www.yahoo.com
 
FAST-WebCrawler: http://www.alltheweb.com
 
Slurp :http://www.inktomi.com
 
MSNBOT :http://search.msn.com
 
5.注意事項:
 
1)robots.txt必須放置在站點的根目錄下,而且文件名必須全部小寫。
 
2)不要在robots.txt文件中設置所有的文件都可以被搜索蜘蛛抓取。
 
3)為安全考慮,建議很重要的文件夾不要寫在robots.txt文件中,或你只建一個空白robots.txt文件,在不要訪問的目錄中加入其它的技術(目前還在探索中……)。
 
seo會聚網robot.txt文件實例:www.seohj.com/robots.txt。
 
我們也可以通過Robots META標簽來針對一個個具體的頁面。關于Robots META標簽的詳細介紹在Robots META標簽用法。
 
1.語法:
 
<meta name="robots"content="搜索方式">
 
2.說明:
 
在該語法中,搜索方式的值和其對應的含義如下:
 
all:頁面將被檢索,且頁面上的鏈接可以被查詢;
 
none:頁面不能被檢索,且頁面上的鏈接不可以被查詢;
 
index:頁面將被檢索,但不設置鏈接是否可以被查詢;
 
follow:頁面上的鏈接可以被查詢;
 
noindex:頁面不能被檢索,但頁面上的鏈接可以被查詢;
 
nofollow:頁面能被檢索,但頁面上的鏈接卻不可以被查詢。
 
3.實例:
 
該實例設定網頁能被檢索,但頁面上的鏈接卻不可以被查詢,代碼如下:
 
<html>
 
<head>
 
<title>限制搜索方式</title>
 
<meta name="robots"content="index">
 
</head>
 
<body></body>
 
相關推薦
  • robots.txt怎么寫 robots.txt寫法及作用

    robots.txt一般是指robots.txt協議。Robots協議(也稱為搜索引擎蜘蛛協議)的全稱是網絡爬蟲排除標準(Robots Exclusion Protocol),網站通過Robots協議...

  • 帶你玩轉robots協議 robots協議怎么寫 新手必備

    2013年2月8日北京市第一中級人民法院正式受理了百度訴奇虎360違反Robots協議抓...

  • 反向鏈接是什么意思?

    反向鏈接其實就是在目標文檔內部進行聲明。換言之,常規鏈接在文檔A中標明指向文檔B,而反向鏈接則在文檔B中要求使文檔A指向我。 概述 假設把網頁文檔A中包含的指向B的鏈接...

  • 酒店開房名單網上惡性蔓延 住客信息或繼續泄露

    如家、漢庭等大批酒店的開房記錄被第三方存儲并因漏洞而泄露的消息日前又有了最新進展,北京商報記者昨日獲悉,一份網傳的泄露名單已在網絡流傳。此次事件后,盡管一些經濟...

  • 百度搜索結果今起優先展現原創內容

    百度一直在醞釀的原創星火計劃已經悄然上線。在搜索引擎結果中,百度通過優先標識、展現互聯網原創內容的方式,幫助網民更便捷地獲取原創內容信息,將用戶流量更多導向原創...

  • 蘋果5G版手機 分析師預測蘋果5G版手機將于明年推出

    天風國際分析師郭明錤發布最新預測報告,稱預測2020年蘋果將推出3款iPhone,均采用OLED屏幕,并且其中兩款支持5G網絡。 報告預測,2020年iPhone產品線將包括高端的6.7吋與5...

版權聲明:

1、本文系會員投稿或轉載自網絡,版權歸原作者所有,旨在傳遞信息,不代表看本站的觀點和立場;

2、本站僅提供信息發布平臺,不承擔相關法律責任;

3、若侵犯您的版權或隱私,請聯系本站管理員刪除。

好健康網 www.m-car.com.cn 蘇ICP備20209186號
主站蜘蛛池模板: 色婷婷综合久久久中文字幕 | 国产亚洲精品久久久久久牛牛 | 加勒比啪啪 | 日干夜干天天干 | 日韩欧美一区二区三区视频 | 躁天天躁中文字幕在线 | 狠狠色网| 97夜夜澡人人爽人人喊一欧美 | 欧美视频区 | 国产成人综合欧美精品久久 | 久久午夜影院 | 伊人97在线 | 黄 色 毛片免费 | 国内视频一区二区 | 免费国产一区二区三区 | 大色综合色综合资源站 | freesex性woman欧美 | 亚洲国产成人在线 | 久久大香线蕉综合爱 | 亚洲αv久久久噜噜噜噜噜 亚洲аv电影天堂网 | 亚洲入口无毒网址你懂的 | 国产成人v爽在线免播放观看 | 欧美一级第一免费高清 | 视频一区中文字幕 | 日本不卡1 | 中文字幕一区二区三区不卡 | 天天插在线视频 | 国产一区二区播放 | 亚洲精品系列 | 深夜视频免费在线观看 | 中文字幕在线一区二区三区 | 九色婷婷 | 日韩高清性爽一级毛片免费 | 国产亚洲美女精品久久久久狼 | 国产精品久久久久久久久齐齐 | 美女一级a毛片免费观看 | 在线天堂bt中文www在线 | 亚洲一区二区三区电影 | 扒开末成年粉嫩的小缝强文 | 伊人网在线免费视频 | 影院在线观看免费 |