查看: 79|回复: 4

[讨论] 搜索不遵守规则怎么办

[复制链接]

85

主题

267

回帖

0

积分

热心网友

金币
267
阅读权限
220
精华
0
威望
0
贡献
0
在线时间
0 小时
注册时间
2012-7-2
发表于 2021-12-30 11:51:06 | 显示全部楼层 |阅读模式
弄了一个备份站点不对外开放,放损友们的游戏截图游戏宏备份等,游戏友们内部使用(当然没有学习日语的视频,都是一群不正经的正经人)
并且在论坛根目录下的
robots.txt  规则只有两行
  1. #
  2. # robots.txt for Discuz! X3
  3. #

  4. User-agent: *
  5. Disallow:/

禁止所有搜索引擎抓取,可谷歌蜘蛛还是时常来,是规则有问题么?
规则, 备份, 正经, 一个, 站点
回复

使用道具 举报

30

主题

178

回帖

0

积分

热心网友

金币
178
阅读权限
220
精华
0
威望
0
贡献
0
在线时间
0 小时
注册时间
2008-1-20
发表于 2021-12-30 14:09:18 | 显示全部楼层


如果你是想要我这种效果,那很容易。如果想要蜘蛛不来,很难,人家凭什么不来?就因为你一纸空文就不来?人家不做生意了吗?谷歌号称全球最大流氓,你指望人家不来?


回复

使用道具 举报

85

主题

267

回帖

0

积分

热心网友

金币
267
阅读权限
220
精华
0
威望
0
贡献
0
在线时间
0 小时
注册时间
2012-7-2
 楼主| 发表于 2021-12-30 14:54:28 | 显示全部楼层
谷歌做为全球性大公司,不遵守robots君子协定,这倒有些意外
对了  你的robots能分享下么
回复

使用道具 举报

2

主题

185

回帖

0

积分

热心网友

金币
185
阅读权限
220
精华
0
威望
0
贡献
0
在线时间
0 小时
注册时间
2009-9-12
发表于 2021-12-30 21:18:24 | 显示全部楼层
  1. User-Agent: *
  2. Disallow: /

好像您的版本少了空格

另外 robots.txt 也不会完全避免采集,他还是会定期爬一下 robots.txt 的。
另外有的软件防火墙会干掉 robots.txt 访问,如果干掉的话也不能终止爬取。
回复

使用道具 举报

85

主题

267

回帖

0

积分

热心网友

金币
267
阅读权限
220
精华
0
威望
0
贡献
0
在线时间
0 小时
注册时间
2012-7-2
 楼主| 发表于 2021-12-31 05:02:09 | 显示全部楼层

改真是,少了个空格
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

相关侵权、举报、投诉及建议等,请发 E-mail:qiongdian@foxmail.com

Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.

在本版发帖返回顶部