新闻资讯
看你所看,想你所想

定向爬虫

定向爬虫

定向爬虫是网路爬虫的一种。定向爬虫可以精準的获取目标站点信息。

基本介绍

  • 中文名:定向爬虫
  • 类型:网路爬虫
  • 作用:精準的获取目标站点信息
  • 特点:基于模版的信息提取技术
定向爬虫获取信息,配上手工或者自动的模版进行信息匹配,将信息进行格式化分析存储。
优势:
基于模版的信息提取技术,能提供更加精準的信息。比如价格,房屋面积,时间,职位,公司名等等。
劣势:
目标网站难以大面积覆盖,因为基于模版匹配的信息提取技术,需要人工的参与配置模版,欲要大面积覆盖各个目标网站,需要大量的人力成本,同样维护模板也需要很大的人力成本。

相关推荐

声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:yongganaa@126.com