这篇文章将给大家介绍,如何使用爬山虎采集器来采集一点资讯新闻文章。
首先,下载爬山虎采集器,安装完成之后打开软件。
在软件起始页的简易采集,点击开始使用
然后点击新闻媒体分类,找到一点资讯新闻文章,点击进入
然后点击立即使用,来使用这个采集规则。进入到这个采集规则后,我们需要设置要采集的一点资讯频道地址,这里我们演示采集娱乐,http://www.yidianzixun.com/channel/c3 ,其他频道地址,用户可以自己从一点资讯上复制过来。
点击开始采集后,爬虫软件就可以自动开始采集,其中采集的内容包含 标题、链接、时间、作者、评论数量、内容这些字段。
爬虫的实时采集状态
一点资讯默认瀑布流式的更新方式,每次采集数量大约50条左右,这是不断更新的。第二次采集时,又会采集到新的内容。