我们日常在采集数据时,一些网站高频率采集、数据量大,采集速度快,容易触发防采集,弹出验证码窗口
页面会停止加载,那么在爬山虎中如何解决这一问题?可以通过设置验证码检测
,来解决这个问题。
具体操作如下:
- Step1:点击地址栏左边的工具图形按钮,点击
设置验证码识别
,进入到验证码设置界面。
- Step2:勾选
启动验证码检测
,点击选择元素
,点击网页中和验证码相关的元素
。
设置完成后,点击测试
,来测试验证码配置,检测成功后,返回列表数据
,根据提示,输入对应的验证即可。
完整的设置流程如下:
注:如果在采集过程中检测到网页出现验证码,程序会等待用户输入验证码或者拖动验证码,直至验证码成功后 继续采集。