在之前文档中有下载单图片的介绍,参考下载图片
那么如果遇到一篇文章中有多张图片,或者是一个图集形式的,如何下载呢?
有2种方式可以实现:
- 直接采集包含多张图片元素(img)的内容HTML(取值属性设为 InnerHTML或 OuterHTML)
- 通过手动编写 XPath,选择多张图片元素(取值属性设为 src)
然后设置'文件下载'
关于第二种方式,如何选择编写 XPath 以获取多张图片元素呢?
比如有2张图片XPath:
/li[1]/img[1]
/li[1]/img[2]
那么我们需要的XPath就是:
/li[1]/img
如果2张图片XPath如下:
/li[1]/img[1]
/li[2]/img[1]
那么我们需要的XPath就是:
/li/img[1]/