replytocom导致百度重复收录
以前也发现百度在TC更新文章几分钟后就收录了TC的文章,但是后面有没了,有时候收录的不是很正常的连接,而是带replytocom=数字结尾的网页,也就是评论的网页参数,一般来说重复收录的情况分为同站重复收录和非同站重复收录两种。后者是其他站抄袭自己的站,或者镜像网站,对自己本身的网站影响不大。而前者重复收录的是同一个站内的页面,严重的话可能导致被k。
那么该怎么解决了?
解决的方法就是在robots.txt中写下规则禁止蜘蛛收录。在robots.txt中添加以下代码即可:
Disallow:/*?replytocom=
谷歌的蜘蛛对于重复页面,类似锚链的这种情况是具有很强的识别能力,是不会被收录的,但是百度不行,显然百度的技术显然还是差强人意,有待完善。我这个站点的是wordpress程序,对于其他站点类似这种情况可以同样按照这个思路解决。
我的好像就被K了
2012-07-05 上午 9:28百度还是google?
2012-07-05 上午 11:57