有什么好方法防止自己网页的内容被采集

80酷酷网    80kuku.com

     防采集第一种方法:在文章的头尾加上随机广告

        网站采集者在采集时,通常都是指定头尾特征从哪到哪过滤.我们这里讲的第一种方法:文章头尾加随机广告,当然随机广告是不固定的。
        比如你的文章内容是"校内网涂鸦代码",则随机广告的加入方法:
        <div id="xxx">随机广告1欢迎访问校内网涂鸦代码站随机广告2</div>
        注:随机广告1和随机广告2每篇文章只要随机显示一个就可以了.

        防采集第二种方法:在文章正文页面插入重复特征头尾代码的注释。文章列表加随机不同的链接标签,比如<a href="",<a class="dds" href=''

        当然,这个可以用正则去掉,但足于对付通用的CMS采集系统了。。
        <!--<div id="xxx_文章ID">-->
        其它标题或内容...
        <!--<div id="xxx_文章ID">--> <div id="xxx_文章ID">
        随机广告1欢迎访问4399com小游戏站随机广告2
        <--</div>--></div><--</div>-->

        防采集第三种方法:加在文章列表的随便链接样式。
        即:正文头尾或列表头尾添加<!--重复特征代码-->
        原理是让采集的人无法抓到列表链接规律,无法批量进行采集.

        请看:
        <a href="xxx.html">标题一</a>
        <a alt="xxx" href="xxx.html">标题二</a>
        <a href='xxx.html'>标题三</a>
        <a href=xxx.html>标题四</a>

  如果你把三种方法全部加上,我想一定能让想采集的人头疼半天而放弃的..
  如果你还问,如何防止别人复制采集呢?要做到这一点容易,把你的网站的网线拔了,自己给自己看就好了.

分享到
  • 微信分享
  • 新浪微博
  • QQ好友
  • QQ空间
点击: