1. 教程中心
  2. 常见问题

如何采集文章内的多张图片

2018/2/8 23:43:17 0 497

在之前文档中有下载单图片的介绍,参考下载图片

那么如果遇到一篇文章中有多张图片,或者是一个图集形式的,如何下载呢?

有2种方式可以实现:

  1. 直接采集包含多张图片元素(img)的内容HTML(取值属性设为 InnerHTML或 OuterHTML)
  2. 通过手动编写 XPath,选择多张图片元素(取值属性设为 src)

然后设置'文件下载'

关于第二种方式,如何选择编写 XPath 以获取多张图片元素呢?

比如有2张图片XPath:
/li[1]/img[1]
/li[1]/img[2]

那么我们需要的XPath就是:
/li[1]/img

如果2张图片XPath如下:
/li[1]/img[1]
/li[2]/img[1]

那么我们需要的XPath就是:
/li/img[1]/