近期以来xlcx网站的log统计一直很高,在IP很少的情况下PV和hit都被放大到很高,且url集中在xlcx_result.php这查询结果页面,明显有人在恶意访问,开始怀疑可能有人通过漏洞去抓取学历数据。
上周让树做了一些调整,包括限制xlcx_result.php的入站页面和js的跳转,但是从weblog分析来看效果并不明显。周五让树在页面中加了统计,今天看了下统计文本,如下:
20080418162757–116.205.152.251–false–2006–113361200606635211–晋建明–ok
20080418162757–116.205.152.251–false–2006–113361200606576124–晋建明–ok
20080418162757–116.205.152.251–false–2006–113361200606694935–晋建明–ok
20080418162757–116.205.152.251–false–2007–105231200705162679–韩飞–ok
20080418162757–116.205.152.251–false–2006–113361200606715659–晋建明–ok
20080418162757–116.205.152.251–false–2006–113361200606674836–晋建明–ok
标签定义分别是:
查询时间 — 查询IP — 是否成功 — 输入的年 — 输入的学号 — 输入的姓名 — 页面返回
和以前所想不通,所有查询数据均只有这两个姓名信息,切查询结果为false,基本排除抓取数据的可能;
频率很高,基本上一秒钟的查询量为30次左右;
IP变化,查询IP来源很广,天南海北各运营商都有,不过都为个人用户的IP。
初步判断可能是也许是恶意访问,但是这种攻击方式对web服务器影响很少,每天的http流量也不过10多G,基本可以忽略这种影响,但是可以考虑在web服务器上增加对同一IP的访问数限制来控制一下。
另:这两个查询数据的学生来源于同一所学校,荆门职业技术学院,有点意思哦