这篇文章将给大家介绍如何使用爬山虎采集器来自己自媒体的爆文文章。
首先下载爬山虎采集器,安装完成之后打开软件。
在软件起始页的简易采集,点击开始使用
然后点击新闻媒体分类,找到今日头条首页新闻采集,点击进入
然后点击立即使用,来使用这个采集规则。
进入到这个采集规则后,我们需要设置要采集的头条分类地址,默认是首页 https://www.toutiao.com/ 这里我们演示采集热点,https://www.toutiao.com/ch/news_hot/
点击开始采集后,软件就会自动采集头条的爆文文章,包含 标题、链接、作者、评论数量、内容、时间这些字段。
采集完成之后,我们可以点击查看数据,检查下文章内容。默认采集的文章是HTML格式,这样发布到网站后,可以保持原来的排版。