定向爬虫
定向爬虫是网路爬虫的一种。定向爬虫可以精準的获取目标站点信息。
基本介绍
- 中文名:定向爬虫
- 类型:网路爬虫
- 作用:精準的获取目标站点信息
- 特点:基于模版的信息提取技术
定向爬虫获取信息,配上手工或者自动的模版进行信息匹配,将信息进行格式化分析存储。
优势:
基于模版的信息提取技术,能提供更加精準的信息。比如价格,房屋面积,时间,职位,公司名等等。
劣势:
目标网站难以大面积覆盖,因为基于模版匹配的信息提取技术,需要人工的参与配置模版,欲要大面积覆盖各个目标网站,需要大量的人力成本,同样维护模板也需要很大的人力成本。