(翻译) 搜索引擎-17个Google不具有的创新功能

2008-02-09 – 4:05 am

原文:Top 17 Search Innovations Outside Of Google
链接:http://www.readwriteweb.com/archives/top_17_search_innovations.php

不断有大量的新的搜索引擎出现 (最新的统计有100多个 ) - 每一个都有一些先锋的,创新的技术。这里有17个引人注目的创新, 我们认为它们代表着未来的方向。它们主要有以下4类:查询预处理(Query Pre-processing);信息源(Information Sources); 算法优化(Algorithm Improvement); 结果展示和后处理(Results Visualization and Post-processing)。

[这里的有些创新在Google已经多多少少地存在了,但是象我们后面说的那样,它们与Goggle(至少在主要页面上提供的功能里-Google还有一些实验的功能)有很大的不同。]

 

查询预处理(Query Pre-processing)

这类创新的方法是通过预测用户的目的以提供更符合用户需求的信息。

1. 自然语言处理 Natural Language Processing

这个功能最先是由Ask.com提出的。另外两个广为人知的例子是HakiaPowerset,虽然实现的方法不同,但是它们都说通过试图理解用户查询的信息的语义来理解用户查询的目的。与Google最大的不同是它们对于”stopwords“(例如 by, for, about, of, in这些连词,Google简单地忽略它们)很重视,通过这些可以理解用户查询的词语的管辖从而提供更准确的信息。

2. 个人相关 Personal relevance (aka personalization)

根据用户的不同,来处理搜索的结果,可以给用户提供相关性更高的信息。Google已经提供了这项功能的支持,但是仅仅在你已经登陆的情况下。很多用户由于对个人信息保密的考虑,不愿意这么做。 [Even John Battelle agrees that the idea is a little scary, although Matt Cutts from Google disagrees.] 现在需要的是如何在匿名的前提下实现类似的功能,可以在保护用户隐私和提供更好的服务之间找到平衡。Collarity 是一个提供这方面功能的搜索引擎。

3. 定制搜索Canned, specialized searches

这是个很简单,但是也很强的功能。最好的例子是SimplyHired,一个工作的垂直搜索引擎,可以提供功能强大的预定义的搜索,例如“对雇员最友好的雇主”或者“可以带狗上班的公司”等等。

信息源Information Sources

这些功能专注于对于信息源的优化。附加的信息内容和信息来源的限定可以帮助用户找到最有用的信息(减少垃圾).

4. 新内容类型-New content types

很明显地,现在的孩子们更多地习惯于在手机上交换图片、视频和短消息。网络上的“富媒体”信息(图像,音频,视频,TV等等)也越来越流行。搜索引擎需要提供对这些媒体的更好的支持。

- 富媒体搜索:声音 (odeo, podzinger ), 视频 (Youtube, truveo ), TV (Blinkx ), 图像 (Picsearch, Netvue )
- 特殊内容搜索: 博客 (Technorati ), 新闻 (Topix ), 分类搜索 (oodle)

当然,Google也在这些领域做出了很大的努力,例如 Google博客搜索 (blogs), Searchmash (images), Google视频, Google新闻和其他一些功能。所以在这个列表中包含这个内容可能对Google不是很公平。但是Google没有将这些功能集成在一起,象Searchmash开始做的那样,这方面Retrevo 是一个好的例子。

5. 限制数据源-Restricted Data Sources

网上的垃圾信息经常使得搜索用户很沮丧。随着网站拥有者对于搜索引擎的了解和更多SEO技术的使用,搜索结果的质量在不断地下降。 (Google作为最流行的搜索引擎,对于Google的专门优化是最多的)。限定只在一部分信任的网站进行搜索可以解决这个问题,虽然这样做也限制了搜索结果的内容,但是这样可以提供更高质量的内容给搜索者。

这方面最好的例子是A9.com,它可以提供针对多个不同数据源的搜索,并且用户可以定制搜索。 Google Co-opYahoo! Search Builder 使得第三方可以建立这样的解决方案。 Rollyo 是这方面的先驱。

6. 专领域搜索(垂直搜索)Domain-specific search (Vertical Search)

专注在一个单独的垂直领域,搜索引擎可以提供好得多的用户体验,更加全面和优化的搜索结果。现在已经有大量的针对不同领域的垂直搜索的例子。可以参考Alex Iskold’s article 或者 this overview 。 [供参考, Sramana Mitra’的文章 overview of online travel services 提供了垂直搜索引擎如果更好满足用户需求的说明。]

算法优化(Algorithm Improvement)

这些创新致力于改进搜索引擎的算法,从而提高搜索结果与用户搜索目的的相关度,提供新的能力。

7. 参数搜索 Parametric search

这种搜索更像数据库查询而不是简单的文本搜索,它通过一系列的问题来确定搜索结果。参数搜索更致力于找到一个问题的解决方案而不是仅仅一篇文章。例如, Shopping.com 允许你指定材料,品牌,风格和价格等等来搜索服装;象 indeed 那样的工作搜索网站让你可以指定地区搜索;GlobalSpec 让你可以设置很多参数来搜索工程相关材料组件(例如指定参数来搜索工业管道). 参数搜索是垂直搜索引擎的一个重要功能。

Google已经在它的高级搜索页面提供了一些基本的功能,但是大多数没什么用处。只有提供了额外的可选择的参数或者你可以把你的搜索控制在一个窄的垂直范围内这些功能才有帮助。

8. 广泛输入 Social Input

Yahoo!的Bradley Horowitz确信 广泛输入(social input) 可以为搜索引擎技术带来巨大的变化。来自大量用户的搜索和选择,可以帮助搜索引擎确认哪些是用户最需要的内容。当然,这些结果可能并不适合每一个人,但是确实是符合大多数人的需要的。 del.icio.us 看起来通过这个方法为用户提供了高质量的搜索结果。 [An earlier post offers a comparison among the different findability solutions based upon “crowd-sourcing”.] 另外一些例子是 StumbleUpon, Squidoo, About.com和Wikipedia - 它们每一个都提供了超乎寻常的能力,虽然有些并不是严格意义上的搜索引擎。

当然, Google的PageRank技术也是基于广泛输入的。因为它是基于互联网上指向一个网页的链接的多少来确认一个网页的重要程度的。

9. 人工输入 Human Input

ChaCha 那样的搜索引擎实际是靠人工来响应用户的搜索的。另外,Yahoo! Answers 是这个领域的另外一个例子。它依靠的是网上的其他人员而不是网站的工作人员来回答问题。

10. 语义搜索 Semantic Search

最近的一些研究希望可以使得整个网络的信息更加智能化。这些才是开始,他们希望能够实现一个语义网络。这个领域的先驱是 Monitor110,它试图从网络上提取有用的财务信息而为有兴趣的投资者服务。Spock, 是一个”people-search”引擎(刚刚是Beta版), 但是当它的数据库发布时 计划获得上亿的收入 ; Riya, 一个可视搜索引擎,可以通过照片实现面部和文字识别。

11. 主动发现 Discovery support

个人化和代理技术为搜索带来了巨大的机会。虽然现在的搜索模式占主导地位,但是很多用户并不会长期固守在某个技术上。如果你可以自己发现新的信息源或信息,特别是高质量的信息,这难道不是很吸引人吗?

现在在这些技术上已经有了一定的进步,例如搜索和RSS的结合。你已经可以在Google或Yahoo上设置对于RSS的搜索。Bloglines 已经提供了推荐种子的功能,显然地,一个种子阅读器在对你感兴趣的领域向你推荐信息方面已经占据了有利的位置。这个领域的另外一个例子是Aggregate Knowledge,它提供定制服务,让你从多个Web网站定制你需要的信息。这将是未来的一个重要发展方向。

结果展示和后处理(Results Visualization and Post-processing)

这类改进重点在于搜索结果的显示和再下一步的处理功能。

12. 分类,标签云和集合 Classification, tag clouds and clustering

QuinturaClusty 这类的搜索引擎可以把结果按照标签或关键字分类显示,可以让用户不仅仅看到搜索的结果,而且可以把结果按照关系来分类。这样可以帮助用户从中更好地提取需要的信息。

13. 结果展示 Results visualization

人的大脑比较容易理解图像,一些特殊的用户界面可以把搜索结果和它们之间的关系用图表显示出来。这类方法在真的特定的内容的时候更为有效,例如针对某个领域的垂直搜索引擎。Thinkmap提供的 Visual Thesaurus ,来自Inxight Software 的VizServer 和来自real estate search engine TruliaHeatMaps 是这方面的例子。虽然这方面的研究才刚刚起步,但是在一些领域已经有了进展。例如 HousingMaps 可以清晰地提供房子的位置供你租赁或购买。

14. 结果提取和过滤 Results refinement and Filters

通常,在得到搜索结果以后,我们需要从中提取我们需要的信息。 这和Google下面提供的关键字参考不完全一样,它不是简单地列出一些关键字的组合来供你进行下一部搜索,而是针对搜索的结果进行进一步的提炼,从中取得更有价值的信息。

尽管没有得到应有的重视,但是查询结果的提取在搜索过程中是非常重要的一个环节。一个很好的例子是医疗搜索引擎 Healia,可以让用户按照统计数字来搜索需要的医疗服务。这是很重要的,因为例如年龄、种族、性别等等在不同的医疗服务中很重要。

Google最近增加了“在结果中搜索”的功能,这是正确的一步。我们可以期望这个功能在以后变得更好。

15.跨平台 Results platforms

社会上的媒体信息和在线内容越来越流行,用户也有的更多种数字设备的选择。搜索引擎必须支持更多的不同的平台的选择,Web浏览器,移动设备,RSS,邮件等等。用户也会有更多种有针对性的搜索设备,例如一个TiVo系统可能需要搜索电影和电视节目,而一个Nintendo系统可能需要搜索在线游戏。

现有的一些搜索引擎已经可以支持除Web浏览器和移动设备以外的更多的平台。Plazoo 很久以来就提供RSS的搜索结果,而 Quintura 则开始就是一个RIA应用,最近才开始提供Web界面。

实现多平台支持的最简单的方法,是实现一个开放的API接口,使得第三方开发人员可以创建针对新的平台的应用。 Alexa Web Search platform 是最早提供这样接口的搜索引擎 (虽然你要自己承担风险 ); 另外一些现存的API包括 oodle, zillowtrulia .

当然,Google也提供这样的API,例如Google Base, Google Maps 和the AJAX search API - 但是它们都不是针对主要的搜索功能。Google也提供对于GoogleMobile的支持,Google Base和Blogsearch 已经提供了RSS输出。

16. 相关服务 Related Services

技术上来说,这并不是搜索功能的一部分。但是,当你完成了一次搜索查询,一般你都要基于搜索结果做后续的工作,例如当你搜索到一个有效的工作以后,你希望能够应聘这个工作。从最终用户来看,这是搜索的一部分。

令人惊讶地是,这类功能还远远没有被开发。搜索引擎在这方面的努力远没有关键字广告上面用得多。这方面一个比较成功的例子是the web’s too big , 它可以被用来搜索位于英国的公众关系代理商的信息。它还提供了一些 有趣的附加功能: 用户可以输入详细的公众关系需求,然后通过一个点击把它送给多个关系代理商。相似的,房地产搜索引擎Zillow提供了Zestimate 的概念(Zillow估算的房屋价格) 和Home Q&A 功能。 这些附加相关服务增加了搜索结果对于用户的价值,也提高了用户附着度。

Google在一些功能上提供了搜索相关服务,例如Google Map可以查找某地提供某种服务的单位。但是在其主搜索功能上没有这类附加功能。

17. 搜索代理 Search agent

基本上搜索代理的意思相当于按照兴趣定制搜索功能并以Feed返回用户。可以想象一下,一个软件可以定期地按照你定制的需求来搜索互联网,监视网上的新的信息,收集结果,移除重复的内容,然后定期地反馈给你。例如,监视你有兴趣的新工作,新出售的房子,服装的新式样等等。

Copernic 提供这方面的服务 - 它可以自动保存你的搜索条件,然后在网页有变化时返回新的结果的汇总。Connotate Technologies 也提供定期检测网络变化的功能。Read/WriteWeb有一篇文章 来介绍Allth.at , SwamiiSearchbots.net .

总结

显然,Google不会被这些新技术的冲击打倒。它的个性化搜索功能已经被集成到它的主要搜索功能中,而且它会逐步集成更多的新的功能到它已经很成功的主要业务中。比如说,垂直搜索功能将是一个很强大的工具。

将来是非常可能发生的是,Google主页上一个简单的搜索框后面会隐藏了很多强大的功能。在另一方面,由于Google有很强大的现有功能,集成进更多的新功能并不影响现有的功能,对Google也是一个挑战。这样对其他搜索引擎也可能是新的机会。

这里有一篇文章讲述 一个概念性的系统结构 关于如何将新的功能和主流搜索集成在一起。

参考

Notable recent articles on “Google and Search Innovation”

Josh Kopelman/Redeye VC: Google - The next vertical search engine?
O’Reilly Rader (via Sarah Milstein): Thoughts on the State of Search
Don Dodge: What’s new in search technology? Is Google it?
Rich Skrenta: How to beat Google, part 1
Information Arbitrage: Domain Expertise: The Key to Next Generation Search
David Berkowitz: The Hunt for Search Engine Innovation, Part 1
Richard MacManus/RWW: Interview with Google’s Matt Cutts about Next-Generation Search
Phil Butler on Hakia and Powerset
Bob Stumpel: SEARCH 2.0 - consolidated
Google Operating System: What Has Google Done in Search Lately?

Popularity: 27% [?]

Leave a Reply

You must be logged in to post a comment.