近两个月测试,发现yahoo,youdao,live完全没有收录,也没注意看蜘蛛爬行日志。也许他们对allow和disallow的优先级定义是一样的,所以只和先后顺序有关。
修改:将allow放在前面,disallow放在最下面,再继续测试它们对 $ * 的支持。
*经过一天发现yahoo和live search收录。看来他们将allow和disallow定义是同等的。
*经过近二十天,yahoo收录增加,有道还是没有收录,不测试了。
最终使用的robots.txt文件- User-agent: *
- # 下面三行允许动态形式收录。只为测试,新站可禁止
- Allow: /redirect.php
- Allow: /viewthread.php
- Allow: /forumdisplay.php
- Allow: /archiver/ #允许archiver目录下收录,新站可不用
- Disallow: /*.php #禁止所以动态URL收录
- Disallow: /*/$ #禁止所有目录形式(所以上面要单开archiver收录)
- Disallow: /? #禁止首面的分区收录
复制代码 dz论坛的优化,好多都是测试性质,因为老站好多形式不能改变了,只有采用稳妥的方式,如最新回复redirect.php的301跳转,帖子页和archiver的canonicalf规范化,列表页规范化等。
对于新站,完全可以禁止archiver,robots可以只要最后三行,其它都禁止。 |