今天我们用python来爬取公众号有用信息。那么,方法思路很清晰了,原理就是利用微信公众号文章调用接口来实现公众号文章抓取。
准备工作
需要用到的python模块
from selenium import webdriver
import time
import json
import requests
import re
import random
第一步
登录微信公众号:https://mp.weixin.qq.com/ ,微信公众号文章接口地址可以在微信公众号后台中新建图文消息,超链接功能中获取:
第二步
搜索公众号,获取所有相关的公众号信息,这里选择一个做测试,其他的有兴趣的也可以全部获取。
第三步
获取要爬取的公众号的fakeid
第四步
选定要爬取的公众号,获取文章接口地址
第五步
文章列表翻页及内容获取
完成了以上的步骤,接下来分享完整python代码: