当前位置:首页 > 阿里巴巴图片下载器使用教程
八爪鱼·云采集网络爬虫软件
www.bazhuayu.com
阿里巴巴图片下载器使用教程
本文介绍使用八爪鱼采集阿里巴巴图片的方法。
阿里巴巴上有很多高质量的商品图片。很多时候,我们想把这些的图片保存下来,应该怎么办?
使用八爪鱼采集器,只需做好规则,即可全自动地将我们的想要的图片采集下来。主要经过两大步:先将图片URL采集下来;再通过八爪鱼提供的图片批量下载工具,将URL批量转化为图片。
采集网站:
https://www.1688.com/chanpin/-D4CBB6AFB7FED7B0.html
本文仅以采集阿里巴巴“衣服”商品列表页举例说明。在实际操作过程中,大家可根据需要,更换要采集列表的url。还可使用URL列表循环,批量采集多个商品列表页面的图片。
本文采集的具体字段为:商品标题,商品URL,商品图片地址
八爪鱼·云采集网络爬虫软件
www.bazhuayu.com
使用功能点:
? 分页列表及详细信息提取
http://www.bazhuayu.com/tutorialdetail-1/fylbxq7.html ? AJAX滚动教程
http://www.bazhuayu.com/tutorialdetail-1/ajgd_7.html
步骤1:创建阿里巴巴图片采集任务
1)进入主界面,选择“自定义模式”,点击“立即使用”
八爪鱼·云采集网络爬虫软件
www.bazhuayu.com
2)将要采集的网址复制粘贴到网站输入框中,点击“保存网址”
八爪鱼·云采集网络爬虫软件
www.bazhuayu.com
步骤2:创建翻页循环
1)系统自动打开网页,进入阿里巴巴“衣服”商品列表页。观察网页结构,当把页面下拉至底部的时候,会加载出一批新的数据,随着我们的下拉,页面会有新的数据加载出来。经过2次下拉加载,此页面达到最底部,出现“下一页”按钮。
所以涉及Ajax下拉加载,需要对其进行一些高级选项的设置。点击右上角的“流程“按钮,选中左侧的“打开网页”,打开“高级选项”,勾选“页面加载完成
共分享92篇相关文档