垂直搜索是针对某一行业信息的站内搜索引擎,是搜索引擎的细分和延伸,是对网络上某一类信息的收集与整合,定向分字段抽取出需要的数据进行处理后再返回给使用者。相对搜索引擎的信息量大、查询不准确、深度不够等劣势延伸出来的新的搜索引擎模式,通过针对某一特定行业、某一特定群体或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索网站则显得更加专注、具体和深入。
垂直搜索网站的应用方向很多,比如企业库搜索、供求信息搜索(如:赶集,58)、购物搜索、房产搜索、人才搜索(中华英才,前程无优)、地图搜索、mp3搜索(www.haoting.com)、图片搜索……几乎各行各业各类信息都可以进一步细化成各类的垂直搜索门户网站。
举个例子来说明会更容易理解,比如购物搜索引擎,整体流程大致如下:抓取网页后,对网页商品信息进行抽取,抽取出商品名称、价格、简介……甚至可以进一步将笔记本简介细分成“品牌、型号、CPU、内存、硬盘、显示屏、……”然后对信息进行清洗、去重、分类、分析比较、数据挖掘,最后通过分词索引提供用户搜索、通过分析挖掘提供市场行情报告。