用織夢dedecms建站的站長會發(fā)現(xiàn),dedecms自帶的robots.txt文件設置很簡單(開發(fā)者基于每個網(wǎng)站的目錄結構和優(yōu)化目的不同的 考慮),并不能完全滿足網(wǎng)站的優(yōu)化要求,那怎樣才能結合自己網(wǎng)站的情況,做好robots.txt優(yōu)化呢?以下介紹一點自己的想法,僅供參考。
適用于未偽靜態(tài)的dedecms網(wǎng)站。
user-agent: *
disallow: /dede 管理后臺目錄,需要改名,具體設置后面具體講
disallow: /include 程序核心文件目錄
disallow: /member 會員管理目錄,有些文件可以開放
disallow: /plus 插件及輔助功能目錄 ,有些文件可以開放,如search.php
disallow: /templets 默認模板存放目錄
disallow: /data 系統(tǒng)緩存或其它可寫入數(shù)據(jù)存放目錄
disallow: /uploads 上傳下載文件保存目錄,不想搜索引擎引用圖片的話,禁止
disallow: /images 系統(tǒng)默認模板圖片存放目錄
disallow: /index.php 網(wǎng)站默認首頁,靜態(tài)化的話,最好禁止
disallow: /404.html
allow: /plus/search.php 開放禁止目錄里的具體文件
...
基本設置就是這樣,下面著重講下后臺管理目錄和欄目頁的設置:
1.dede目錄,為了網(wǎng)站安全考慮需要改名。然而改名之后,大家不免疑惑:改了名,在robots.txt文件里怎么設置呢?直接禁止抓取,還是 泄露了后臺目錄,等于改名無效。那么該如何解決這個問題呢?我們可以通過下面的設置解決這個問題,如后臺目錄為dedecms:
disallow: /d*ms
這樣我們就能即禁止了搜索引擎的抓取,又不會泄露了后臺目錄名稱。
2.欄目頁。有些人會注意到,如果網(wǎng)站不做偽靜態(tài)優(yōu)化的話,欄目分頁后會有兩個鏈接指向欄目首頁,如*/web/和*/web /list_1_1.html,為了網(wǎng)站優(yōu)化,建議先將欄目分頁優(yōu)化以下(具體做法大家可以在網(wǎng)上找),把首頁和第一頁的鏈接改為*/web/的形式,然 后在robots.txt文件里做以下設置:
disallow: /*1.html$
以上就是dedecms robots.txt文件的設置,大家可以根據(jù)自己網(wǎng)站的情況具體設置。
注意事項:
1.按官方說明設置好目錄權限;
2.后臺目錄改后的名稱開頭字母和結尾字母不要和其他目錄一樣;
3.用百度站長工具測試一下robots.txt文件設置是否有效。