请停止对“骚扰电话查询”工具的抓取,来提供数据了

2019年07月25日 4023次浏览

最近网站频繁向我发送异常请求通知,原因是有人不断的请求本站的“骚扰电话查询”工具接口。

一秒钟几十个请求过来,我这个小水管服务器顶不了,可怜。


现在我来说下本站的工具是怎么获取这些骚扰电话的信息的。

请看这两个截图,就会明白了。


本站查询结果截图

本站查询结果截图

百度查询结果截图

百度查询结果截图

百度请求的地址是:https://www.baidu.com/s?wd=95205739


现在应该明白了吧,其实本站也是抓取百度的数据。

另外我也弄了个本地的数据库配合使用,你可以到这里下载:https://gitee.com/azoon/saoraodianhuashujuku

这个数据库是我从骚扰电话拦截APP提取的,.sql格式。


本站的“骚扰电话查询”工具是这样工作的:

1.查询本地数据库

2.找到记录就显示本地数据库的数据

3.本地数据库如果不存在记录,再去百度抓取。


抓起百度的相关PHP代码如下。


$html = file_get_contents('http://www.baidu.com/s?wd='.$phone);//$phone手机号
preg_match_all("/<span class=\"op_fraudphone_label(.*)\">(.*)<\/span>/i",$html, $type);
preg_match_all("/被(.*)个/i",$html, $num);
$new_type=trim($type[2][0]);//号码类型
$new_num=intval($num[1][0]);//被举报次数



另外本站的域名whois接口长期被刷,我也不知道这个人的目的是什么,网站已经增加了请求限制,但是这个人还是一直不停的刷,一秒钟用肉鸡发送。郁闷。

Tags: 接口api