第一步:输入网址
采集器没有自动识别到子页面链接,F12查看网页元素,找到对应的链接属性:"onclick"
第二步:添加字段,右键字段:设置取值属性输入:"onclick"
右键字段:手动设置xpath,“.“ 选取当前节点
右键数据处理:新建/正则匹配
观察网站地址,点击不同子页面链接,地址前部分是不变的
右键数据处理:新建/添加前后缀
网址已经全部拼好了
爬山虎采集器“深入链接”命令已弹出 选中链接,深入此链接
按所需选择子页内容,一个详情页链接就构造完成了。
第一步:输入网址
采集器没有自动识别到子页面链接,F12查看网页元素,找到对应的链接属性:"onclick"
第二步:添加字段,右键字段:设置取值属性输入:"onclick"
右键字段:手动设置xpath,“.“ 选取当前节点
右键数据处理:新建/正则匹配
观察网站地址,点击不同子页面链接,地址前部分是不变的
右键数据处理:新建/添加前后缀
网址已经全部拼好了
爬山虎采集器“深入链接”命令已弹出 选中链接,深入此链接
按所需选择子页内容,一个详情页链接就构造完成了。