Python:使用 MitmProxy 自动抓取微信公众号阅读数、点赞和再看数据

   日期:2024-12-16     作者:o93v3      
核心提示:在手机端浏览器输入获取 PC 证书 和手机端的证书,都安装一下注意:android 手机在安装证书时需要在[从存储设备安装]界面安装 阅

在手机端浏览器输入 获取 PC 证书 和手机端的证书,都安装一下

注意:android 手机在安装证书时需要在[从存储设备安装]界面安装

阅读数、再看、点赞抓取


当安装好证书和设置好手机端 IP 代理后,随便点击一篇微信公众号文章(这里使用本公众)

从图上可以看到,阅读、再看、点赞的 url 为 (提示:如果没有这个链接,可以右上角刷新文章),再看下它的 request 请求需要哪些东西

只需要一个文章 url、user-agent、cookie 和 body 这四个基本的数据,别看下面 body 里面有二三十个数据其实都是吓唬人的,只需要其中7个,分别是 __biz, mid, idx,sn 这四个参数是获取公众号文章内容的基石,可以在文章 url 处获得。其他三个参数的数据是固定的分别是 is_only_read = 1,is_temp_url = 0,appmsg_type = 9。getappmsgext 请求中的 appmsg_token 是一个有时效性的参数。

分析完链接后就可以写代码了

import html

import requests

import utils

from urllib.parse import urlsplit

class Articles(object):

“”“文章信息”“”

def init(self, appmsg_token, cookie):

self.appmsg_token = appmsg_token

self.headers = {

“User-Agent”: “Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0Chrome/57.0.2987.132 MQQBrowser/6.2 Mobile”,

“Cookie”: cookie

}

self.data = {

“is_only_read”: “1”,

“is_temp_url”: “0”,

“appmsg_type”: “9”,

}

def read_like_nums(self, article_url):

“”“获取数据”“”

appmsgstat = self.get_appmsgext(article_url)[“appmsgstat”]

return appmsgstat[“read_num”], appmsgstat[“old_like_num”], appmsgstat[“like_num”]

def get_params(self, article_url):

“”"

获取到文章url上的请求参数

:param article_url: 文章 url

:return:

“”"

article_url = html.unescape(article_url)

“”“获取文章链接的参数”“”

url_params = utils.str_to_dict(urlsplit(article_url).query, “&”, “=”)

return url_params

def get_appmsgext(self, article_url):

     本文地址:http://w.yusign.com/tjnews/837.html    述古往 http://w.yusign.com/static/ , 查看更多
 
特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。

举报收藏 0打赏 0
 
更多>同类生活信息

相关文章
最新文章
推荐文章
推荐图文
生活信息
点击排行
{
网站首页  |  关于我们  |  联系方式  |  用户协议  |  隐私政策  |  版权声明  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号