A-A+

网站被恶意镜像怎么办 一段代码轻松搞定(全面版)

2017年02月20日 网站建设 评论 21 条 阅读 1,351 次

网站被恶意镜像怎么办

有时候你会发现,你在搜索引擎输入网站名称的时候,出来的网站信息是你们的,但是域名却是一个陌生的,这种情况可以基本确定网站被镜像了,那么究竟什么叫网站被镜像?

恶意镜像,也叫恶意克隆,恶意解析,是指有人通过域名A记录直接解析别人IP地址,从而得到一个在访问者眼中完全相同网站的过程。其工作原理基本上是这样子的:有用户访问镜像站点时,程序就会来正版的站点查询数据,并修改相关链接然后呈献给用户,实质上还是在读取原站的数据。严谨一点的解释:通过复制整个网站或部分网页内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引的行为 。

网站被镜像的危害

通俗的讲,恶意镜像者意图利用自己有一定权重的域名进行威压,通过某些手段复制了你的站点,除了域名不一样之外,其他内容一模一样,用户或许根本无法分辨。甚至对于一些新的站点,搜索引擎都会迷惑到底哪个是真的站点,那么就有可能正牌的网站被删除收录,而盗版的却被搜索引擎青睐。

虽然目前我们还不知道恶意镜像我们的网站到底有什么意图,但肯定对我们没什么好处,如果他这个域名有点什么不健康的信息,那么我们被镜像的站点有可能被污染掉,所以还是要警惕这个现象。

如何知道自己的网站是否被镜像

复制自己网站的完整标题(PS:查看自己站点首页源码,其中 <title>龙笑天下 - 分享悲伤;共享快乐</title>),然后在谷歌和百度等搜索引擎里搜索,如搜索:intitle 龙笑天下 - 分享悲伤;共享快乐,如果有其他网站的网站标题、描述及网站内容跟你的一样,只有域名不一样,那就是被镜像了。

如何处理网站被镜像

这类镜像看似一个完整的站点,其实上是每次用户访问镜像站点,程序就会来正版的站点查询数据,并修改相关链接然后呈献给用户。实质上还是在读取原站的数据。以下龙笑天下就列举几种解决方法,大家自行取舍使用!

方法1:查清镜像网站的主机Ip,通过禁止Ip来解决

本教程基于WordPress程序,其他系统请自测!

1、获取镜像服务器ip。注:这个IP不是ping到他域名的IP

复制如下代码,新建一个php文件,并命名为“ip.php”上传到你的网站根目录。

2、然后访问你网站的镜像站点,在地址后面加.../ip.php,然后你就会在网站根目录找到ip.txt文件了,打开复制里面的ip地址。

3、然后打开你的.htaccess文件,在后面加上如下代码(自行修改为刚刚获得的ip)

当然,如果你使用CDN,可以直接在CDN后台添加ip黑名单

这个时候你再刷新一下镜像站点,是不是已经403报错了呢?这个时候已经解决了这个镜像站点,然后就等待蜘蛛将其解决掉吧。

此方法的缺点就是如果镜像网站更换了ip,那我们的屏蔽就失败了

方法2:JS来防护

在头部标签:取自 @boke112导航

里加上下面的JS代码:

或加上以下的JS代码:

注意:将上面代码中的www.ilxtx.com改为你网站的首页主地址,如果我上面填写的不是我网站的主地址 www.ilxtx.com,而是 ilxtx.com 的话,就会导致网站一直刷新!

注:经过本站测试,如果镜像站屏蔽了JS,则该方法失效。所以,最好把方法2和方法3结合使用!

方法3:Js被屏蔽后防止镜像的方法

将以下代码加到网站的header.php中:代码取自 @boke112

有些网站会屏蔽掉JS代码(如下面的代码) :

所以 <script>proxy2016 = false;</script> 代码将被过滤掉,img的onerror设置超时时间3000毫秒,将运行函数部分,检测是否还存在proxy2016字符,如果没有找到就会将主机的URL改为www.ilxtx.com;为了安全起见,将js部分可以使用js代码混淆(本站“JS代码混淆” 工具站长之家JS混淆工具)。

本站的混淆结果如下:

经过我的测试,此代码在Chrome、IE11和360极速浏览器上均有效,会跳转到源站的原文章页!在Firefox上则无效果,镜像的文章页并不会跳转到原站...... 将代码中img标签的src引用地址改为空格或无效的图片地址后,在Firefox上也起作用了!

方法4:借助Img的Onerror事件

20161119更新(增加搜狗快照支持):此方法使用了后,会导致百度快照、谷歌快照、必应快照和搜狗快照等跳到404页面(360搜索快照则不会~),奈何不知怎么弄,2016-11-10再次经过张戈的指导,将原代码中的:if( str1!=str3 ) 改为 :if( str1!=str3 && str3!="cache.baiducontent.com" && str3!="webcache.googleusercontent.com" && str3!="c.360webcache.com" && str3!="cncc.bingj.com" && str3!="snapshot.sogoucdn.com" ) 。估计要等快照更新时才能知道效果了!

20161127:经过验证,上述更新已经起作用了!具体效果,请点我~

通过拆分域名链接与镜像站比对,然后用img标签src空值触发onerror来执行js比对,比对失败则跳转回源站。

①、WordPress专用版

经过 @张戈 童学的不断改进(IE不支持 window.stop() 函数,所以“20160909版本”失效...),已经完美的适配Firefox、Chrome、IE11和360极速浏览器,而且可以跳转至源站的相应文章页,在此衷表感谢!下面3段任选一个即可。效果请看这里:http://www.ilxtx.com.3s3s.org/the-shawshank-redemption-1994.html

代码如下:(复制粘贴到主题的functions.php最后一个?>之前)

Ps:如果是丢到wp_head,经过测试发现图片放到head,浏览器会自动进行错误调整,导致一些本来在head的元素被丢到了body当中,比如style.css,估计网页标准中head里面就不应该放置图片,所以移到了footer当中。

或者
或者
Tips:如果想像“20160909版本”一样有个提示语,可将上面这段代码改为此
20160909版本

②、HTML通用版

既然是利用js代码,那么就能用到如何html页面当中了。要不是为了可以放到wp的functions.php,都没必要写成php的模式,直接用html代码即可:

将以上代码中的: var currentDomain="www." + "ilxtx" + ".com"; 自行拆分成自己的域名,避免被镜像代码替换掉,比如: var currentDomain="zhangge." + "net";

然后将代码添加到网站的 <body> 之后即可(不建议放置到 <head> 里面,具体原因上文已说明),这个版本适合任何网页。

方法5:通过禁止某些User Agent特征来防

服务器反爬虫攻略:Apache/Nginx/PHP禁止某些User Agent抓取网站
我们都知道网络上的爬虫非常多,有对网站收录有益的,比如百度蜘蛛(Baiduspider),也有不但不遵守robots规则对服务器造成压力,还不能为网站带来流量的无用爬虫,比如YY蜘蛛(Yis...
阅读:321    评论:10

参考上面这篇文章来禁止UA为PHP的抓取网页,从而达到防镜像的目的!

①、PHP通用版:

将下面的代码贴到网站入口文件index.php中的第一个 <?php之后即可:

②、Wordpress适用版

如果使用上面的php版本,WordPress每次更新就会需要操作index.php,比较麻烦,因此弄个专版。

将下面的代码贴到 functions.php 中的最后一个 ?>之前即可:

经过测试,在functions.php中加入此代码后,打开镜像站后显示“Internal Server Error”,强制刷新后显示我们设置好的提示文字“请勿采集本站,采集者木有小JJ!请正常访问,并认准【龙笑天下网】官方网址!”。

本站目前发现的恶意镜像域名

dijicat.com
lapaleo.com
iaroex.com
disauvi.com
3s3s.org
ytlqpo.com
s3.gvirabi.com
hdtmail.com
dimyapi.com

更多镜像网站等你提供~

在这些域名前面加上你们自己的的域名,看看有没有被恶意镜像。

友情提示:建议方法2和方法3一起使用!方法4包含方法2和方法3~

 
文章为龙笑天下原创,转载请注明出处来自http://www.ilxtx.com/mirrored-website.html
标签:

21 条留言  访客:17 条  博主:4 条

  1. 123124

    if (document.location.host != “www.ilxtx.com”) {
    location.href = location.href.replace(document.location.host,‘www.ilxtx.com’);
    }

    这个没用了,网站之前加了,效果还好过了几个月就没用了
    location.href.replace(document.location.host,这段直接被替换成了它的网站

  2. 微赚会

    会技术真可怕哈,代码各种懵逼呀 :mrgreen:

  3. 第9页

    现在暂时不怕镜像了。

  4. 小虾网赚

    以前被镜像过,这些方法很实用,转了

  5. 博客导航

    方法四相对比较好

  6. 马洪飞博客

    很久之前我也被克隆了哈哈

  7. 捕鱼游戏

    很有用的四个方法

  8. 靠谱学生兼职网

    如果真的遇到这情况,我可能都懒得去解决它

  9. 我要网赚

    没看懂的飘过

  10. 发发网赚

    虽然看不懂,还是得感谢博主

  11. 业余兼职网

    哦,用的是跳转方式,学习了,

  12. 乐赚168网赚博客

    镜像大可怕。还好有博主的总结

  13. 简单生活

    以前公司小站被镜像过!!!!

  14. 不套路butaolu.com

    七号就是悲剧,还好弄好了

  15. 分钱榜www.fenqianbang.com

    不错的,万一哪天就用上了。比如某淘金

    • 马超金博客

      我也是这么想的,所以转载收藏

  16. 道德经

    我是被镜像过好几次,百度投诉解决的

  17. 纯洁

    多谢博主分享技术

给我留言

Copyright © 马超金博客 保留所有权利.站长QQ 760679295   Theme  Ality 粤ICP备18000481号-2

用户登录 ⁄ 注册

分享到: