12下一页
返回列表 发帖
查看: 101|回复: 15

[已解决] robots.txt 的問題

14

主题

45

回帖

67

积分

渐入佳境

贡献
0 点
金币
5 个
发表于 昨天 11:23 |台湾| 查看全部 |阅读模式
請教先進Discuz! X3.5 的內建robots.txt 問題,內建有下列4行︰
Allow: /data/attachment/
Allow: /data/avatar/
Allow: /data/cache/
Allow: /uc_server/data/avatar/
上面第1行是請網路蜘蛛去/data/attachment/ 目錄抓取,但是這個目錄下面還有很多目錄,是只同意網路蜘蛛抓取/data/attachment/這個而已,或是連同該目錄下所有的目錄一併抓取?
上面第2行請網路蜘蛛去/data/avatar/ 目錄抓取,這個目錄只有index.htm 及noavatar.svg 這兩個檔案,沒有其它目錄,index.htm 大小為0, noavatar.svg 查詢是個空白人頭,允許抓這兩個檔案對SEO 有影響嗎?
上面第3行是請網路蜘蛛去/data/cache/ 目錄抓取,這個目錄有非常多的js,及css,沒有其它目錄,抓取js 與css 對SEO 有幫助是嗎?沒有幫助的話其用途為何?
上面第4行是請網路蜘蛛去/uc_server/data/avatar/ 目錄抓取,這個目錄裡面跟2. 一樣只有index.htm 及noavatar.svg 這兩個檔案,但還有一個000目錄,這個目錄裡面是一些會員頭像圖,跟1. 問題一樣,網路蜘蛛會抓會連同抓取子目錄嗎?
最後就是如果robots.txt 裡面沒有Allow,也沒有Disallow 的目錄及檔案,網路蜘蛛會如何處置?
謝謝
1 贡献

最佳答案

wish 发表于 2026-1-20 15:23
感謝回覆,針對請網路蜘蛛去/data/attachment/ 目錄抓取,但是這個目錄下面還有很多目錄,Allow: /data/a ...

Allow: /data/attachment/ 這條規則:
允許抓取 /data/attachment/ 目錄本身
同時允許抓取該目錄下所有的子目錄
包括任意層級的子目錄和所有文件
回复

使用道具 举报

0

主题

5

回帖

15

积分

初学乍练

贡献
1 点
金币
5 个
产品版本
更早版本
发表于 昨天 14:32 |北京| 查看全部
# 允許附件目錄(用戶上傳的內容可能有價值) Allow: /data/attachment/  # 禁止訪問快取和頭像目錄 Disallow: /data/avatar/ Disallow: /data/cache/ Disallow: /uc_server/data/avatar/  # 其他建議的禁止目錄 Disallow: /data/backup/ Disallow: /data/log/ Disallow: /data/tmp/ Disallow: /install/ Disallow: /config/ Disallow: /uc_server/data/cache/ Disallow: /uc_server/data/logs/
回复

使用道具 举报

0

主题

5

回帖

15

积分

初学乍练

贡献
1 点
金币
5 个
产品版本
更早版本
发表于 昨天 14:40 |北京| 查看全部


  1. # 允許附件目錄(用戶上傳的內容可能有價值)
  2. Allow: /data/attachment/

  3. # 禁止訪問快取和頭像目錄
  4. Disallow: /data/avatar/
  5. Disallow: /data/cache/
  6. Disallow: /uc_server/data/avatar/

  7. # 其他建議的禁止目錄
  8. Disallow: /data/backup/
  9. Disallow: /data/log/
  10. Disallow: /data/tmp/
  11. Disallow: /install/
  12. Disallow: /config/
  13. Disallow: /uc_server/data/cache/
  14. Disallow: /uc_server/data/logs/
复制代码

附件目錄:用戶上傳的圖片/文件可能有價值,可以保留
頭像目錄:個人頭像對 SEO 無價值,且可能涉及隱私
快取目錄:臨時文件,無索引價值,浪費爬蟲配額
系統目錄:保護敏感信息和後台路徑

建議
使用 XML 網站地圖:明確告訴爬蟲哪些是重要頁面
檢查實際被索引的頁面:在 Google Search Console 查看
考慮用戶隱私:特別是頭像等個人信息
回复

使用道具 举报

39

主题

6499

回帖

1万

积分

应用开发者

贡献
648 点
金币
1450 个
QQ
发表于 昨天 15:14 |浙江| 查看全部
这都是标准规范,并不是DZ独有的,搜索一下基本就知道了
回复

使用道具 举报

14

主题

45

回帖

67

积分

渐入佳境

贡献
0 点
金币
5 个
 楼主| 发表于 昨天 15:23 |台湾| 查看全部
duckweed 发表于 2026-1-20 14:40
附件目錄:用戶上傳的圖片/文件可能有價值,可以保留
頭像目錄:個人頭像對 SEO 無價值,且可能涉及隱私 ...

感謝回覆,針對請網路蜘蛛去/data/attachment/ 目錄抓取,但是這個目錄下面還有很多目錄,Allow: /data/attachment/ 是只同意網路蜘蛛抓取/data/attachment/這個目錄而已,或是連同該目錄下所有的目錄一併抓取?
回复

使用道具 举报

0

主题

5

回帖

15

积分

初学乍练

贡献
1 点
金币
5 个
产品版本
更早版本
发表于 昨天 15:32 |北京| 查看全部
wish 发表于 2026-1-20 15:23
感謝回覆,針對請網路蜘蛛去/data/attachment/ 目錄抓取,但是這個目錄下面還有很多目錄,Allow: /data/a ...

Allow: /data/attachment/ 這條規則:
允許抓取 /data/attachment/ 目錄本身
同時允許抓取該目錄下所有的子目錄
包括任意層級的子目錄和所有文件
回复

使用道具 举报

39

主题

6499

回帖

1万

积分

应用开发者

贡献
648 点
金币
1450 个
QQ
发表于 昨天 15:34 |浙江| 查看全部
wish 发表于 2026-1-20 15:23
感謝回覆,針對請網路蜘蛛去/data/attachment/ 目錄抓取,但是這個目錄下面還有很多目錄,Allow: /data/a ...

除非有进一步的禁止命令,否则就是覆盖子级的
回复

使用道具 举报

0

主题

5

回帖

15

积分

初学乍练

贡献
1 点
金币
5 个
产品版本
更早版本
发表于 昨天 15:36 |北京| 查看全部
wish 发表于 2026-1-20 15:23
感謝回覆,針對請網路蜘蛛去/data/attachment/ 目錄抓取,但是這個目錄下面還有很多目錄,Allow: /data/a ...

Allow: /data/attachment/
誤解:只允許目錄本身
錯誤理解:只允許訪問 http://example.com/data/attachment/(目錄列表頁)
實際情況:目錄下的所有內容都允許

限制訪問深度:
明確禁止子目錄
Allow: /data/attachment/
Disallow: /data/attachment/*/
# 這表示允許文件,但禁止子目錄
回复

使用道具 举报

0

主题

5

回帖

15

积分

初学乍练

贡献
1 点
金币
5 个
产品版本
更早版本
发表于 昨天 15:38 |北京| 查看全部
事實上,作為一名 spider,是不會看和遵守這個協議的。採集的深度是看需求的程度,當然我也明白你這個協議是以後法律的依據
回复

使用道具 举报

71

主题

253

回帖

350

积分

炉火纯青

贡献
1 点
金币
11 个
发表于 昨天 15:39 |宁夏| 查看全部
好的 知晓
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

  • 关注公众号
  • 有偿服务微信
  • 有偿服务QQ

手机版|小黑屋|Discuz! 官方交流社区 ( 皖ICP备16010102号 |皖公网安备34010302002376号 )|网站地图|star

GMT+8, 2026-1-21 05:38 , Processed in 0.049316 second(s), 13 queries , Redis On.

Powered by Discuz! X5.0 Licensed

© 2001-2026 Discuz! Team.

关灯 在本版发帖
有偿服务QQ
有偿服务微信
返回顶部
快速回复 返回顶部 返回列表