前几天有人私信我,问能不能帮忙抓取摩拜单车的数据。。。
我想着授人以鱼不如授人以渔,所以本次我们就讲讲如何抓取手机app的内容吧
目录
Fiddle的安装及配置
抓手机包我用的是fiddle。
安装
先在下载页面下载-→
选择你“准备用fiddle来干嘛”
你的邮箱
以及同意“最终用户许可协议”就可以下载了
下载后按照提示安装就可以了。
配置
点击tool->telerik fiddler options…
点击connections,然后勾选 “allow remote computers to connect”,记住这边的端口号(8888)
开始抓包
首先确保电脑和手机连在同一个WiFi下面
打开fiddle
获取电脑ip
打开cmd命令行
输入ipconfig,如图所示,192.168.31.146就是我的ip地址
打开手机WiFi设置,找到你当前链接的WiFi
我当前链接的是Xiaomi_E172_5G
设置代理服务器为你电脑的ip,端口号为上面设置的端口号(默认为8888)
安装https证书
在手机浏览器上打开 你电脑ip:你设置的端口号
我的是192.168.31.146:8888
点击框框处安装证书
设置fiddle监听所有请求
选择all process
打开摩拜单车app
然后你会看到定位的时候一辆车也没有。。。
打开个人详情页还提示“抱歉,服务暂不可用。。。“
这是因为摩拜有防抓取限制(我猜是检测,如果有使用代理的话,直接让你用不了。。。)
那这样的话我们就没办法抓到么???
因为我之前还用过摩拜的小程序,所以我们抓抓小程序试试看
打开摩拜单车的小程序
我们看到已经定位了。。,并且把附件的单车都显示出来了
我们可以多移动我们的位置,然后等有把附近的车显示出来
可以看到fiddle上面已经有好多请求了
那么如何找到摩拜的那一条呢。。。
很简单,看单词就好。。。
mobike-api。。。这很明显就是我们要找的请求
请求头如下图所示,方法是post
参数如下图
返回值因为我看到是json的格式了,所以直接以json的格式看。
那么直接模拟发送吧
直接看代码吧。。。
import requests
# 如果headers里面没有referer则会访问异常
# referer表示上一个页面是什么。
headers = {
User-Agent: Mozilla/5.0 (iPhone; CPU iPhone OS 10_3_1 like Mac OS X) AppleWebKit/603.1.30 (KHTML, like Gecko) Mobile/14E304 MicroMessenger/6.5.7 NetType/WIFI Language/zh_CN,
Content-Type: application/x-www-form-urlencoded,
Referer: https://servicewechat.com/wx80f809371ae33eda/23/page-frame.html,
}
url = https://mwx.mobike.com/mobike-api/rent/nearbyBikesInfo.do
data = {
longitude:121.1883,# 经度
latitude:31.05147, # 纬度
citycode:021,
errMsg:getMapCenterLocation:ok
}
# 下面必须加上verify=False,表示不验证ssl,要不然一直报错。。。
z = requests.post(url,data=data,headers=headers,verify=False)
可以看到我们已经抓取了需要的数据,那么怎么抓取整个上海的摩拜单车情况呢??只要获取上海的所有经纬度,然后替换上面data中的经度及纬度就可以了。。。
那么怎么获取上海的所有经纬度。。。
我发现挺难的。。。(有人拿到了请告诉我一声,谢谢)
然后我用了高德地图api的搜索功能,搜索了上海的所有小区的经纬度。一共898个,
然后查了这898个小区附件的摩拜单车情况….
总结
看完本编文章,你应该学会“如何抓取手机app的包”
其实挺简单的(就是你手机通过电脑上网,然后这台电脑上所有的请求都被抓下来了,那么你手机的请求自然也被抓下来了)
大家还可以试着抓抓知乎客户端的包。。。
更多fiddle的使用技巧,请善用百度、Google
最后所有代码在
扫描下面二维码关注我,更多关于爬虫的精彩内容~