Jsrpc 学习——Cookie 变化的网站破解教程
大家好,我是皮皮。前几天给大家分享 jsrpc 的介绍篇,Python 网络爬虫之 js 逆向之远程调用(rpc)免去抠代码补环境简介。
今天给大家来个 jsrpc 实战教程,让大家加深对 jsrpc 的理解和认识。下面是具体操作过程,不懂的小伙伴可以私我。
1、对 Cookie 进行 hook,需要在浏览器的控制台输入命令Object.defineProperty(document, "cookie", {set:function(a){debugger}})

2、之后点击下一页,进入 debug 模式
3、依次点击右边的 Call Stack 内的东西,直到找到加密函数,里边的值对应请求参数即可判定。
4、之后可以在控制台输入指令window.dcpeng = ct.update
,其中ct.update
为加密函数。注意:这个地方挺重要的,很多时候我们会写成 ct.update(),这样会有问题!加了括号就是赋值结果,没加就是赋值整个函数!千差万别。

5、关闭网页 debug 模式。注意:这个地方挺重要的,很多时候如果不关闭,ws 无法注入!
6、此时在本地双击编译好的文件win64-localhost.exe
,启动服务。

7、之后在控制台注入 ws,即将JsEnv.js
文件中的内容全部复制粘贴到控制台即可(注意有时要放开断点)。

8、连接通信,在控制台输入命令var demo = new Hlclient("ws://127.0.0.1:12080/ws?group=v&name=test");
9、随后继续输入命令:
//注册一个方法第一个参数 get_v 为方法名,
//第二个参数为函数,resolve 里面的值是想要的值(发送到服务器的)
//param 是可传参参数,可以忽略
demo.regAction("get_v",function(resolve,param){
//varc="好困啊"+param;
varc=dcpeng();
resolve(c);
})

10、之后就可以在浏览器中访问数据了,打开网址http://127.0.0.1:12080/go?group={}&name={}&action={}¶m={}
,这是调用的接口 group 和 name 填写上面注入时候的,action 是注册的方法名,param 是可选的参数,这里续用上面的例子,网页就是:http://127.0.0.1:12080/go?group=v&name=test&action=get_v

11、如上图所示,我们看到了那个变化的参数 v 的值,直接通过 requests 库可以发起 get 请求。
12、现在我们就可以模拟数据,进行请求发送了。

13、将拷贝的内容可以丢到这里进行粘贴:http://tool.yuanrenxue.com/curl

14、之后将右侧的代码复制到 Pycharm 中即可用,非常便利。
15、之后就可以构造请求了,整体代码如下所示。
importrequests
v_url="http://127.0.0.1:12080/go?group=v&name=test&action=get_v"
v_res=requests.get(url=v_url).json()["get_v"]
cookies={
'session':'6c78df1c-37aa-4574-bb50-99784ffb3697.Qcl0XN6livMeZ-7tbiNe-Ogn8L4',
'v':v_res,
}
headers={
'Connection':'keep-alive',
'Accept':'application/json,text/javascript,*/*;q=0.01',
'X-Requested-With':'XMLHttpRequest',
'hexin-v':'A3_4zkkuI7xygCZatjHGiHM8DlgKZNPp7bnX-hFMGsZ175EOGTRjVv2IZ04i',
'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/97.0.4692.99Safari/537.36Edg/97.0.1072.69',
'Content-Type':'application/x-www-form-urlencoded;charset=UTF-8',
'Origin':'http://spider.wangluozhe.com',
'Referer':'http://spider.wangluozhe.com/challenge/6',
'Accept-Language':'zh-CN,zh;q=0.9,en;q=0.8,en-GB;q=0.7,en-US;q=0.6',
}
data={
'page':'3',
'count':'10'
}
response=requests.post('http://spider.wangluozhe.com/challenge/api/6',headers=headers,cookies=cookies,data=data,verify=False).json()
print(response)

运行结果如上图所示,和网页上呈现的数据一模一样。

16、至此,请求就已经完美的完成了,如果想获取全部网页,构造一个 range 循环翻页即可实现。
17、也欢迎大家挑战该题目,我已经挑战成功了,等你来战!

总结
大家好,我是皮皮。这篇文章主要给大家介绍了 jsrpc 的实战教程,使用 jsrpc 工具可以在网络爬虫过程中事半功倍,无需仔细的去扣环境,去一步步逆向,只一个黑盒的模式,我们就拿到了想要的结果,屡试不爽。