精英联盟总队|带大家写一波微信公众号的爬取!谁说微信爬不了的
开发工具python版本 : 3.6.4相关模块:pdfkit模块;requests模块;以及一些Python自带的模块 。 抓包工具: fiddler
环境搭建
- python 环境安装Python并添加到环境变量 , pip安装需要的相关模块即可 。
- fiddler 环境去官网下载最新版本的安装包直接安装 。 fiddler官网
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36 QBCore/4.0.1295.400 QQBrowser/9.0.2524.400 Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2875.116 Safari/537.36 NetType/WIFI MicroMessenger/7.0.5 WindowsWechat'}123【精英联盟总队|带大家写一波微信公众号的爬取!谁说微信爬不了的】接着看看cookies , 在这(应该直接复制到代码里就行了):action__bizfoffsetcountis_oksceneuinkeypass_ticketwxtokenappmsg_tokenx5
经过测试 , 我们可以发现如下参数是可以固定的:
actionfis_oksceneuinkeywxtokenx5
其他参数的含义我们则可以根据经验和简单的测试进行判断:
1.offset控制翻页的偏移量参数2.count每页的文章数量3.__biz公众号标识, 不同的__biz对应不同的公众号4.pass_ticket应该是微信登录之后返回的参数吧,去年尝试模拟登录微信网页版的时候看到返回的参数里就好像有它,但是现在微信网页版已经被官方封了T_T 。 5.appmsg_token应该也是微信登录之后的一个标识参数吧, 而且和阅读的微信公众号有关 , 查看不同的微信公众号时该值也是不同的 。
推荐阅读
- 骚狐君|他的存在对鲨鱼产生了威胁,和平精英人气榜公布!牧童稳坐第一
- nba|NBA太疯狂!2组1-1,1组2-2,联盟第1最悲惨!黑马逆袭,成赢家
- 大华联盟|朱元璋下令锯开棺材 6个大字朱元璋脸色大变,刘伯温下葬后
- 英雄联盟|余霜分手后开启奔放模式,一天连晒N组自拍,网友直呼太美了!
- 卡玛拉|《复仇者联盟》:不只是游戏,更是一部优秀的电影
- 和平精英|??“吃鸡”体验服已无更新,暗夜危机2.0,或将被1款新游戏代替!
- 英雄联盟|LOL九周年奖励发放,玩家开始“比惨大会”,你是欧皇还是非酋?
- 悠游侠|漫威复仇者联盟装备怎么升级 装备等级提升方法介绍
- 和平精英|和平精英三大一哥宣告诞生:王小歪排名第一,日赚1W3!
- 英雄联盟|LEC解说强行给帽皇树敌:不管你们怎么说,Caps都会打爆左手!
