推荐一个WordPress开源文章采集插件 可以采集 微信公众号文章 简书 等其他网站
原文地址 . 注: Github 开源作品. 非广告哦
名字是 胖鼠采集(Fat Rat Collect) 这个插件使用需要一点点的Jquery html基础. 插件开发纯属兴趣 。插件是基于php7.x 和 QueryList v4版本 已发布到wordpress官方插件中心。
胖鼠采集(Fat Rat Collect)是一款能够帮助你网站自动化的工具.自动采集,自动发布,省心省力,
他有一些初始化学习的例子有: 微信采集 简书采集 御龙在天新闻采集 寻仙新闻采集 心理咨询师新闻采集 虎扑新闻采集 直播8新闻采集,
并支持爬取任意网站列表详情页面 如(今日头条, 腾讯新闻, 简书, 知乎 …)
注: 胖鼠采集 坚持以开源学习,和大家使用最方便为宗旨!
胖鼠采集是完全内嵌到wordpress插件里面,不需要脱离wordpress,
不会安装其他任何第三方软件. 功能强大。相比其他插件. 胖鼠很有优势.
胖鼠是使用 Html,Jquery语法 爬取和剔除数据. 比其他采集器, 更灵活,
胖鼠软件的设计思想分三大块. ①爬虫模块, ②配置模块, ③数据模块
①爬虫模块主要使用配置模块的各种特色配置来爬取数据.
②配置模块为爬虫模块提供支持.
③数据模块支撑胖鼠各种特色发布功能!
安装插件
在wordpress插件搜索 胖鼠采集 安装即可
Github开源地址
他的作用
自动任务: 可以自动采集文章, 也可以自动发布文章.
手动执行: 自动时间没到? 咱们手动来.
文章过滤: 再用不用担心爬取重复啦.
站群: 定时发布,维护站群好帮手.
导入数据: 一键导入,站群导入.
导入数据: 爬回来的数据预览, 单数据发布.
DEBUG模式: 帮你调试配置规则.
分页爬取: 爬取目标站历史文章.
手动配置采集规则采集任何网站 : 只要你只会一点点Html JQery即可写规则。如果你会一点点Html Jquery。自己搞应该没一点毛病。
例:你可以用爬虫盯着 某新闻网站的 热门新闻列表页 当出现热点事件,他们第一时间更新文章。我们自动定时爬虫就抓到了。
胖鼠采集部分功能图片给大家看一下
上来就有几个默认的配置。大家自动导入直接用。
规则配置非常简单。作者秉承开源精神。给大家做一款开源好用的采集工具。
暂无评论内容