第一步:输入网址

采集器没有自动识别到子页面链接,F12查看网页元素,找到对应的链接属性:"onclick"

第二步:添加字段,右键字段:设置取值属性输入:"onclick"

右键字段:手动设置xpath,“.“ 选取当前节点

右键数据处理:新建/正则匹配

观察网站地址,点击不同子页面链接,地址前部分是不变的

右键数据处理:新建/添加前后缀

网址已经全部拼好了

爬山虎采集器“深入链接”命令已弹出 选中链接,深入此链接

按所需选择子页内容,一个详情页链接就构造完成了。
第一步:输入网址

采集器没有自动识别到子页面链接,F12查看网页元素,找到对应的链接属性:"onclick"

第二步:添加字段,右键字段:设置取值属性输入:"onclick"

右键字段:手动设置xpath,“.“ 选取当前节点

右键数据处理:新建/正则匹配

观察网站地址,点击不同子页面链接,地址前部分是不变的

右键数据处理:新建/添加前后缀

网址已经全部拼好了

爬山虎采集器“深入链接”命令已弹出 选中链接,深入此链接

按所需选择子页内容,一个详情页链接就构造完成了。