replytocom导致百度重复收录

以前也发现百度TC更新文章几分钟后就收录了TC的文章,但是后面有没了,有时候收录的不是很正常的连接,而是带replytocom=数字结尾的网页,也就是评论的网页参数,一般来说重复收录的情况分为同站重复收录和非同站重复收录两种。后者是其他站抄袭自己的站,或者镜像网站,对自己本身的网站影响不大。而前者重复收录的是同一个站内的页面,严重的话可能导致被k。

那么该怎么解决了?

解决的方法就是在robots.txt中写下规则禁止蜘蛛收录。在robots.txt中添加以下代码即可:

Disallow:/*?replytocom=

谷歌的蜘蛛对于重复页面,类似锚链的这种情况是具有很强的识别能力,是不会被收录的,但是百度不行,显然百度的技术显然还是差强人意,有待完善。我这个站点的是wordpress程序,对于其他站点类似这种情况可以同样按照这个思路解决。

本文固定链接: http://20tc.com/replytocom-baidu.html | TC的博客

该日志由 TC 于2012年01月04日发表在 wordpress 分类下, 你可以发表评论,并在保留原文地址及作者的情况下引用到你的网站或博客。
原创文章转载请注明: replytocom导致百度重复收录 | TC的博客
关键字: , ,

replytocom导致百度重复收录:目前有2 条留言

  1. 沙发
    IT开发网 China Mozilla Firefox Windows :

    我的好像就被K了

    2012-07-05 上午 9:28 [回复]
    • TC China Mozilla Firefox Windows :

      百度还是google?

      2012-07-05 上午 11:57 [回复]

发表评论


*

快捷键:Ctrl+Enter