这次我将演示使用GooSeeker,这是一个优秀的爬虫软件,整个生态我觉得也是不错的,相比于庞大复杂的scrapy,GooSeeker的GUI操作绝对是一大亮点和优势,而且GooSeeker不光能够爬取静态页面,动态页面也一样可以覆盖。
对于python小白,或者只是需要使用爬虫功能的非编程爱好者,这绝对是值得入坑的一款软件。对了,对于非企业级的爬虫,基本是免费的。
对了需要注册账号,但是不要觉得麻烦,注册之后就很方便了,又不需要交钱。
官网
传送门
点击下载就好,安装方面没有什么坑。
具体操作步骤如下所示:
首先需要先建立一个模拟点击的规则,但是一条规则必须要有关键内容才能确保执行,所以首先找一个关键内容:
这样能够做到有顺序的执行。
注:这里的任务名相当于是预留的,还没有创建。
然后存储规则:
新建另一条规则,这时候需要点击加载更多,然后刷新页面的读取结构,进入的二级规则的制定:
去掉内容定位的对勾,然后点击加载更多,再恢复内容定位的对勾。
评分也是一样:
结果正确。保存规则。