八爪鱼·云采集网络爬虫软件
www.bazhuayu.com
淘宝卖家信息采集步骤17
4)对于“店铺ID”,先弄清楚“店铺ID”是个什么类型的数据,然后页面上未展现,则看看网页源码里是否有这个数据。百度后可知“店铺ID”是shop
八爪鱼·云采集网络爬虫软件
www.bazhuayu.com
后接一串数字的数据,如“shop123123123”。查看源码,发现可以找到该信息。
5)准备工具:火狐浏览器(54版或之前版本),安装firebug和firepath插件。其他工具能查看源码斌顺利写XPath也可以。 A. 在浏览器中打开网页,然后找到对应的数据区域 B. 逐个检查该区域源码,找到符合要求是数据。
淘宝卖家信息采集步骤18
八爪鱼·云采集网络爬虫软件
www.bazhuayu.com
C. 根据目标数据——点评ID,所在位置写出其XPath路径。此处的XPath路径为://li/a[@trace=\
淘宝卖家信息采集步骤19
八爪鱼·云采集网络爬虫软件
www.bazhuayu.com
9)点击网页图片选择抓取图片地址(选择其他的也可以,重点是生成一个数据
字段并含有相对XPath)。
淘宝卖家信息采集步骤20
10)选择自定义字段,对该字段进行XPath和提取方式的修改。