垂直搜索引擎的信息服务特点分析
摘要:本文以2010年10月上线试运行的时尚购物类搜索引擎“一淘网”为例,由水平搜索引擎和垂直搜索引擎的差异入手,从搜索结果的排列方式、结构化特征、查准率、增值服务和客户体验五个角度切入,分析了垂直搜索的信息服务特点,并在此基础上提出垂直搜索引擎在现阶段发展过程中出现的问题。
2010年10月9日10时39分,淘宝网旗下垂直搜索引擎一淘网beta版上线试运行,成为继番薯网、去哪儿网分别领跑电子图书、在线旅游领域后,时尚购物领域崛起的又一大搜索引擎,垂直搜索正发展为未来最拥挤的市场。
2010年,搜索引擎用户规模已达3.2亿人,占网民总数的76.3%,并且这一比例在逐年增长。①网民喜欢使用搜索引擎,是因为搜索引擎能够帮助用户在海量的信息中迅速实现目标信息的精确定位。然而随着互联网技术的迅速发展和各类信息的爆炸式增长,传统搜索引擎的信息覆盖率和有效信息的抓取效率明显下降,“搜索噪音”不断加重,受众对搜索引擎的预期和传统搜索引擎提供的服务之间的鸿沟越拉越大,此时,相关性、针对性更强的信息抓取工具垂直搜索引擎出现了。
垂直搜索引擎究竟有多大的发展空间与其定位、内容、用户、市场策略等特点密不可分。本文以一淘搜索为例,从其信息服务内容入手,对垂直搜索的信息服务特点做详细剖析。
垂直搜索引擎和水平搜索引擎
水平搜索引擎。水平搜索引擎即传统意义上的搜索引擎,是相对于垂直搜索引擎定义的。它信息覆盖面广,针对全网进行信息采集,用户通过输入关键字即可获取任何形式、任何主题的信息。但是由于它信息覆盖面广,返回的信息往往会有死链接多、相关度低的缺点并且由于更新周期的要求,采集的深度(层级)较浅。针对以上问题,人们提出了针对性、专业性更强,重复率更低、查准率更高的垂直搜索引擎。
垂直搜索引擎。垂直搜索引擎也被称为专业或者专用搜索引擎,就是专为查询某一学科或主题的信息而产生的查询工具,专门收录某一专业、某一行业、或者某一主题的信息。②具体而言,就是对网页库中某类专门的信息进行了一次整合,定向分字段抽取需要的数据,进行处理后再以某种特定的形式返馈给用户,是搜索引擎的细分和延伸。
垂直搜索引擎和传统的搜索引擎最大的不同在于,它对网页信息进行了结构化的信息抽取,返回给用户的是结构化的信息数据。垂直搜索将信息去重、分类、索引,建立数据库以备用户提取。简言之,传统搜索引擎是以网页为基本单位,垂直搜索引擎是以结构化的数据为基本单位。
垂直搜索的信息服务特点
信息服务的内容是指信息服务者在信息服务活动中为用户提供的特定的产品和服务。③搜索引擎为用户提供的信息服务的产品即返回的搜索结果,服务即满足用户除搜索结果之外其他需求的方式。
垂直搜索引擎和水平搜索引擎很大的不同体现在产品上。为了直观说明问题,本文以一淘网的搜索结果为实验组,传统的水平搜索引擎谷歌的搜索结果作为对照组进行实验。如上文所述,垂直搜索引擎均有特定的搜索领域,因此选择使用特定垂直搜索引擎的用户都大致明白该搜索引擎的定位领域。一淘网定位于时尚购物领域,因此笔者在实验中选择搜索商品,在二者的搜索框内均输入“手套”二字。
个性化的搜索结果排列方式。基于大规模搜索日志的分析,绝大多数用户只翻看搜索引擎返回的前10条结果④,也即有效信息的平均数量为10。因此,本文中着重分析搜索引擎返回的前10条搜索结果。
首先来看谷歌返回的搜索结果。其共返回24,200,000条信息,其中返回的前10条信息,涉及购物网站、图片、名词解释等多个方面,但是没有一条结果是和作为商品出售的手套本身直接相关的。将搜索结果翻到第二页,也即完全跳出了对用户有效的10条信息的范围,才陆续出现出售手套的信息,并且商品信息依然混杂在大量的图片和新闻信息中。
其次,对比一淘的搜索结果。一淘网的搜索框下设“导购”“商品”“淘吧”“问答”“网页”“机票”六个选项卡,用于商品信息的精确定位。即在用户输入目标词汇之前,就能对搜索引擎返回的结果做出信息范围的选择。默认的是“商品”选项卡,输入“手套”,返回的结果即众多正在出售的手套的信息。不仅如此,一淘网还可以由顾客自主决定商品在网页上的排序:价格升序,价格降序,信用升序,信用降序等。
当网民以购物为目标但使用的是传统搜索引擎时会发现,搜索引擎返回的搜索结果和自己的购物心理有很大的偏差。这也正是传统的搜索引擎面临的一个问题,其呈现的信息已经按照搜索引擎自身的规则进行了排序,比如百度的竞价排序,用户在信息排序调整上的权限很小,只能被动接受机器设置的顺序。这样一来,传统搜索引擎的排序在很大程度上就决定了用户看什么信息,而不是用户自己决定看什么信息。而垂直搜索引擎所建立的人机关系,不再是人去适应机器,而是机器来主动适应人的需求。无论是一淘,还是其他垂直搜索引擎,均可以按照用户输入的条件进行相关度的排序,这也就凸显了垂直搜索提供的搜索结果的特点:受众的主动性大大提升。
结构化的搜索结果。仍然以“手套”的搜索为例,以谷歌为代表的传统的搜索引擎返回的是网页的链接,匹配的原则是网页和输入关键词的匹配度。这是语义层面的搜索,通过关键词的匹配,搜索出含有目标词汇的网页,呈现给用户的信息包括标题、简述和url链接三部分,并且网页中匹配的关键词往往已经标红突出。但是想要明确知道该条信息是否能为己所用,需要打开链接,仅靠搜索引擎返回的一级网页是无法直接获得有用信息的。
垂直搜索则不同,虽然它也同样基于关键词的匹配,但是它给出的搜索结果却是结构化的数据。以本次搜索为例,一淘给出了图片、商家、颜色、质地、价格、成交数量等和用户想要查找的产品密切相关的信息,这样就使得用户不需要逐个点进链接来确认该条信息是否对自己有用。简言之,垂直搜索为用户提供的是特定领域内的元数据。
搜索结果具有较高的查准率。同样是针对“手套”这一搜索,谷歌返回了24,200,000条搜索结果,一淘的商品选项卡返回了1,096,734个搜索结果,在查全率上,以谷歌为代表的传统搜索引擎是占有明显优势的。但是巨大的信息覆盖面在给传统搜索引擎带来查全率上的优势的同时,还带来了查准率的损耗。翻看本次查询结果,谷歌虽然返回的信息量很大,但是排序靠前的大多数信息和用户想要的信息并不相关,甚至会出现相关信息数量小而且湮没在不相关信息中的情况。反观一淘搜索为代表的垂直搜索,尽管返回的搜索数量远不如传统搜索引擎,但是因为其在特定的网站进行信息抓取,信息的准确率高,甚至能达90%以上。⑤
重视增值服务。搜索引擎争抢客户的竞争不只在搜索结果这一产品领域,还出现在搜索引擎所提供的服务领域。
目前网络上各类网站往往都会通过注册会员、送积分、开通VIP会员等方式增加用户黏度。那么增值服务到底有没有用呢?以电子邮箱为例,艾瑞调研数据显示,目前用户选择邮箱时,对技术层面决定的安全性的看重已经下降到了第八位,除排名第一的登录便捷性之外,用户在选择个人免费邮箱时还看中功能、速度、增值服务等各方面因素。⑥2009年网易、腾讯、Gmail的用户满意度排名位列前三,这主要得益于三者在邮箱功能上不断开发各种差异化及亮点性功能。个性化服务大大方便了用户使用,也博得了用户的青睐和好评。由此不难看出,在基本的技术水平差异不大的情况下,增值服务在很大程度上左右着用户的选择。
具体到垂直搜索引擎市场,目前已经较为成熟的去哪儿网已经建立起了自己的会员制,现在正处于试运行阶段的一淘并没有开通单独的会员注册和登录服务,目前阶段的会员是和淘宝、支付宝用户直接对接的。那么实际上,淘宝会员和支付宝会员享受的增值服务就是一淘网会员享受的服务。无论是淘宝的会员积分,支付宝会员积分,淘宝网淘金币的超值换购,支付宝不断拓展的业务范围还是淘宝网针对每个客户的消费推荐,淘宝网和支付宝都将用户牢牢地捆绑在自己的身边。所以一个淘宝会员,在享受电子商务便捷的同时,还能为自己积攒信用额度,享受淘宝网为自己量身打造的消费推荐,享用因为消费积分带来的回馈。增长的服务链条将买卖的战线拉长,使一次消费变成了多次,一次访问变成了长期、稳定的访问。
重视客户体验。中国互联网络信息中心发布的《2009年中国搜索引擎用户行为研究报告》显示,左右人们首选搜索引擎品牌的最重要因素是“用习惯了”,占到了调查数量的29.9%。一般情况下对新生的网络事物来说,一个月还不足以建立起用户的习惯,但是一淘网因与淘宝界面的操作方式和使用方法的高度类似,不仅省略了用户对一淘的适应阶段,而且还将淘宝老用户对淘宝的习惯性依赖转移到一淘网身上。
《2009中国网络购物市场报告》显示,淘宝网用户单一度最高,有79.3%的淘宝用户只在淘宝网上购物。如此高的排他依赖性毫无争议地证明了淘宝网优秀的用户体验。那么作为以淘宝为搜索平台的一淘,用户对淘宝的使用习惯就是对一淘的使用习惯,淘宝网巨大的市场占有率为一淘打开市场提供了条件。
无论是淘宝还是今天的一淘,都是极为重视用户体验的。当年淘宝刚刚进军C2C市场时,全球最大的电子商务网站ebay已经占有了80%的市场份额。但是淘宝在短短几年翻盘,靠的就是这种高度本土化的思维:ebay采取的不显示确定价格的竞价方式是不符合中国人的消费习惯的,那么淘宝就采用了固定价格策略,大大增加了中国人在买卖关系中很看重的确定性;中国人更看重买卖过程中买卖双方的交流沟通,于是淘宝及时推出阿里旺旺,实现卖家和买家的及时联络;中国人尤其看重经济成本,那么淘宝就舍弃了ebay作为主要收入来源的店铺佣金,采用免费店铺的策略。今天的一淘,在淘宝经验的基础上更进一步:中国人喜欢关注他人的购物习惯,于是一淘首页设立了四个排行榜;中国人都相信人多的地方东西肯定好,于是一淘又设置了实时的成交展示。优质的用户体验,为一淘的进一步发展创造了条件。
垂直搜索信息服务的主要问题
检索范围有待扩大。无论是时尚购物领域的一淘,还是电子图书领域的番薯网、旅游搜索领域的去哪儿网,搜索结果都会比直接在传统的水平搜索引擎上输入关键词得到的信息少很多。一淘网在创建之初,所有的数据来源均来自淘宝网,目前虽已扩展至京东、当当、卓越亚马逊等8个购物平台,但返回的结果仍比传统搜索少很多。搜索结果的局限性暴露出了垂直搜索引擎目前面临的一个巨大问题:检索平台信息量少。垂直搜索引擎的信息多源自几个固定的垂直门户网站,如果垂直门户网站收录的信息量不够大,那么垂直搜索引擎对用户来说用处就不大。用户可以选择放弃垂直搜索引擎,直接到垂直门户网站上去检索,或者调整自己的提问用词,使用传统搜索引擎获得最为完整的信息。因此,扩大垂直搜索引擎的检索范围,对于垂直搜索的发展十分重要。
用户交互性有待提高。上文中提到了,传统搜索引擎抓取信息的查准率远不如垂直搜索引擎,这也成为垂直搜索的巨大优势。但是,正是由于传统搜索引擎查准率不高,用户在输入信息时就需要不断和搜索引擎进行交互,不断调整自己的提问要求,比如增加检索词的个数、同义置换检索词等等。通过交互,找到最为准确的信息表达方式,获得目标信息,这对于用户来说是极好的交互体验。相反,垂直搜索引擎的用户如果通过检索词无法得到目标信息,更换检索词还是无法实现目标的,往往只能通过更换搜索引擎在新的范围中搜索信息。尽管享有较高的查准率,但是较为单一的查询模式,对于用户体验来说,是很不利的一个方面。
和传统搜索引擎的合作有待加强。目前看来,网络上常见的垂直搜索引擎和传统搜索引擎都不同程度划清了界限。一淘虽然没有彻底和传统搜索绝缘,但是其网页选项卡提供的网页检索仅来自一淘本身、有道和搜狗。诚然,垂直搜索是在传统搜索引擎的弱点之上研发的,但是相对于发展时间长、用户黏性大、已建立起稳定搜索习惯的传统搜索引擎而言,垂直搜索这种公然对垒的形式显然不利于自身的发展,更多的用户还是通过传统搜索引擎找到垂直搜索的链接,然后再利用垂直搜索引擎进行特定领域信息的检索。也正因为此,虽然垂直搜索引擎数量在不断攀升,但是使用率却不是很高,目前网络上有上百万的搜索引擎,挑战不在于找到买家,而在于让他们找到你。⑦未来的市场格局,是不应该允许如此多的垂直搜索引擎存在的⑧,因此垂直搜索引擎更应该加强技术方面的创新和与传统搜索引擎的合作。
结语
一淘网作为垂直搜索家族中年轻的一员,在半年多的发展过程中已经显示出了垂直搜索的显著优势:搜索结果排列个性化,搜索结果结构化,查准率高,重视用户体验,重视增值服务。但同时也暴露出了当下的垂直搜索普遍存在的问题:搜索范围有限,用户交互性不足,和传统搜索引擎的关系不够明晰等。无论未来垂直搜索将与传统搜索引擎以怎样的方式共存,针对性、相关性更强的垂直搜索已经走进了我们的生活,影响着我们的搜索习惯。(来源:《新闻爱好者》杂志 文/陈晓婉 编选:中国电子商务研究中心)
注释:
①中国互联网络信息中心(CNNIC),《第26次中国互联网络发展状况统计报告》,2010年7月,researchnic/html/1279171593d2348.
html。
②肖冬梅:《垂直搜索引擎研究》,《图书馆学研究》,2003(2)。
③陈新颜:《垂直搜索引擎辨析》,《现代情报》,2004(9)。
④余慧佳、刘奕群、张敏等:《基于大规模日志分析的搜索引擎用户行为研究》,《中文信息学报》,2007(1)。
⑤⑧刘畅:《综合搜索引擎与垂直搜索引擎的比较研究》,《情报科学》,2007(1)。
⑥艾瑞咨询,《2009年—2010年中国个人电子邮箱行业发展报告》,iresearch/Report/view.aspx?Newsid=114374。
⑦王宁宁:《浅谈CNNIC最新报告对垂直搜索引擎领域的启示》,《图书馆理论与实践》,2009(1)。
本文转载自中国电子商务研究中心:b2b.toocle/detail--5912881.html