1.火车头采集器win10怎么安装
火车头采集器采集信息分两个步骤:
1,采网址。这一步也是就告诉软件,有多少个网页需要去采,并给出具体的网页地址。
2,采内容。有了网址之后,就可以去这个网址上采集信息了,但网页上信息众多,软件不知道你想采哪些。在采内容部分,就要做规则了。告诉软件我想采什么。
1,采网址。
网页上的产品信息就是所想采的,即为目标。
在采集链接页面里,输入采集地址的列表页,这里要注意无用链接的过滤。
然后点击测试按钮测试所填信息的正确性:
测试正确以后,我们对地址进行扩展,现在我们只不过是采了一张列表页的文章地址,还有其它的列表要需要采集,其它的列表页就在它的分页上,我们观察这些分布的链接形式,找出规律,然后批量填入网址规则。
2,内容的采集
经过上面的处理,目标产品页的链接都已经能够采到,下面我们进入内容的采集。
明确好要采集的内容以后,我们开始编写采集规则,火车头采集内容是采集网页的源代码,因此我们要打开产品页的源代码,找到我们要采集信息所在的位置。比如,Description字段的采集:
找到Description的位置,找到之后,如何填写采集规则呢,很简单,只要将采集目标的开始字符串与结束字符串填入采集的对应位置。这里我们选取Description:作为开始字符串,为结束字符串。值得注意的是,开始字符串必须在本页面是唯一的,并且在其它产品页面也存在这个字符串。本页面唯一能使软件找到要采集的位置,其它页面通用,保证软件能够采到其它页面的数据。
填完以后并不表示就能采集正确了,还需测试一下,排除一些无用数据,排除可在HTML标签排除和内容排除中进行。测试成功后,这样一个标签就制作好了。
这里我们使用通配符来实现这一要求。我们把不通用的地方用(*)通配符来表示任意。而要采集的地址我们用参数(变量)来表示。最后我们将这段内容变为:(*)Compare Prices(*)
如果测试没有成功,那说明你填入的内容还不符合唯一且通用的标准,还需要调试。测试成功以后,可以保存,进入标签的制作了。
这里的标签制作与上面的是一样的,找到要采集信息的所在地,填入开始结束字符串,并做好过滤,唯一的不同的在于所属页面选项里要选择刚才制作好的模块,这里就不赘述,直接显示结果了。
这样标签就制作完成了。点击更新以后,去掉发布选项,就可以进行任务的采集了。
2.火车头采集器win10怎么安装
火车头采集器采集信息分两个步骤:
1,采网址。这一步也是就告诉软件,有多少个网页需要去采,并给出具体的网页地址。
2,采内容。有了网址之后,就可以去这个网址上采集信息了,但网页上信息众多,软件不知道你想采哪些。在采内容部分,就要做规则了。告诉软件我想采什么。
1,采网址。
网页上的产品信息就是所想采的,即为目标。
在采集链接页面里,输入采集地址的列表页,这里要注意无用链接的过滤。
然后点击测试按钮测试所填信息的正确性:
测试正确以后,我们对地址进行扩展,现在我们只不过是采了一张列表页的文章地址,还有其它的列表要需要采集,其它的列表页就在它的分页上,我们观察这些分布的链接形式,找出规律,然后批量填入网址规则。
2,内容的采集
经过上面的处理,目标产品页的链接都已经能够采到,下面我们进入内容的采集。
明确好要采集的内容以后,我们开始编写采集规则,火车头采集内容是采集网页的源代码,因此我们要打开产品页的源代码,找到我们要采集信息所在的位置。比如,Description字段的采集:
找到Description的位置,找到之后,如何填写采集规则呢,很简单,只要将采集目标的开始字符串与结束字符串填入采集的对应位置。这里我们选取Description:作为开始字符串,为结束字符串。值得注意的是,开始字符串必须在本页面是唯一的,并且在其它产品页面也存在这个字符串。本页面唯一能使软件找到要采集的位置,其它页面通用,保证软件能够采到其它页面的数据。
填完以后并不表示就能采集正确了,还需测试一下,排除一些无用数据,排除可在HTML标签排除和内容排除中进行。测试成功后,这样一个标签就制作好了。
这里我们使用通配符来实现这一要求。我们把不通用的地方用(*)通配符来表示任意。而要采集的地址我们用参数(变量)来表示。最后我们将这段内容变为:(*)Compare Prices(*)Product Details,填入模块,并测试是否成功。
如果测试没有成功,那说明你填入的内容还不符合唯一且通用的标准,还需要调试。测试成功以后,可以保存,进入标签的制作了。
这里的标签制作与上面的是一样的,找到要采集信息的所在地,填入开始结束字符串,并做好过滤,唯一的不同的在于所属页面选项里要选择刚才制作好的模块,这里就不赘述,直接显示结果了。
这样标签就制作完成了。点击更新以后,去掉发布选项,就可以进行任务的采集了。
3.1后台商品采集器怎么设置
很多人说用采集器采集商品的时候总是卡住,在这里我要解释一下: 第一,你的空间问题,采集本来就是一个非常耗服务器资源的事情,再加上你的服务器配置低、网速也不行,就这造成了采集的时候慢,甚至卡住。
第二,采集器设置的问题,采集器的设置一定要仔细并准确,没有API权限的就不要用API采集了,选择淘宝网采集的模式。 商品分类ID这个一定要填分类的CAT值,不要直接填淘宝分类的ID,点击后台的查询分类cat进入分类列表页面,找到你要采集的分类,复制链接后可以看到链接里面有一段cat=数字,其中数字就是CAT值。
紧接着下面的所属分类,这个就是你采集的商品要存入你网站的哪个分类,这个不是淘宝商品的分类。 关键词这里也非常重要,要采集连衣裙就直接填连衣裙,要采集电视机就填电视机,要采集欧莱雅就填欧莱雅,不要搞些稀奇古怪的词,我竟然看到有个客户填了一句话放在里面,不知道他要采集什么。
折扣比率以千为单位。价格设置也很重要,我看有的客户没有设置价格范围,他以为这样会采集到更多的商品,其实错了,没有指定价格的范围反而不容易获取商品,价格范围可以适当的设置小一点,有的人设置1-9999,这太广了,可以设置为30-35之间,这样采集的时候抓取商品更具体,卡住的机率也小些。
销量啊,包邮这些可以任意设置。最后一项来源不要设置成天猫,淘宝网采集模式是随机抓取的,淘宝的和天猫的会一起采集。
第三, 很多人说用采集器采集商品的时候总是卡住,在这里我要解释一下: 第一,你的空间问题,采集本来就是一个非常耗服务器资源的事情,再加上你的服务器配置低、网速也不行,就这造成了采集的时候慢,甚至卡住。 第二,采集器设置的问题,采集器的设置一定要仔细并准确,没有API权限的就不要用API采集了,选择淘宝网采集的模式。
商品分类ID这个一定要填分类的CAT值,不要直接填淘宝分类的ID,点击后台的查询分类cat进入分类列表页面,找到你要采集的分类,复制链接后可以看到链接里面有一段cat=数字,其中数字就是CAT值。 紧接着下面的所属分类,这个就是你采集的商品要存入你网站的哪个分类,这个不是淘宝商品的分类。
关键词这里也非常重要,要采集连衣裙就直接填连衣裙,要采集电视机就填电视机,要采集欧莱雅就填欧莱雅,不要搞些稀奇古怪的词,我竟然看到有个客户填了一句话放在里面,不知道他要采集什么。 折扣比率以千为单位。
价格设置也很重要,我看有的客户没有设置价格范围,他以为这样会采集到更多的商品,其实错了,没有指定价格的范围反而不容易获取商品,价格范围可以适当的设置小一点,有的人设置1-9999,这太广了,可以设置为30-35之间,这样采集的时候抓取商品更具体,卡住的机率也小些。 销量啊,包邮这些可以任意设置。
最后一项来源不要设置成天猫,淘宝网采集模式是随机抓取的,淘宝的和天猫的会一起采集。操作比较复杂的一点点的来 如果对你有帮助就点击 有用 谢谢啦。
4.帮我设置下火车头采集器、
经过4天的制作,火车头采集器V2009最新教程发布了,在制作过程中可能会有些问题,欢迎大家批评指正.火车头采集器V2009正式版 五一快乐!!! 教程第一部 第一步网址规则 主要内容一、系统设置二、规则制作第一步:采集网址规则 三、开始采集地址设置 四、文章内容页面的地址必须包含设置五、页面内选定区域采集网址设置六、采集器获取Cookie设置七、手动填写链接地址规则设置八、HTTP获取方式 这一节主要是讲以上八个内容下载 一、WEB在线发布模块制作1.登陆设置2.刷新列表设置3.随机值获取4.文章发表参数 WEB在线发布模块就讲以上四个内容下载 处理相关阅读 实例 处理图片 实例 下载: /afanfan2007/火车头采集器v2009[最新教程第五部1].avi 二、落伍 主题贴回帖 到 DZ7.0(接口发布) 下载 第五部第一节 /afanfan2007/火车头采集器v2009[最新教程第五部2].avi 下载 第五部第二节 /afanfan2007/火车头采集器v2009[最新教程第五部22].avi。
转载请注明出处windows之家 » win10安装火车头采集器