欢迎来到010在线作文网!

搜索引擎的研究论文(2)

实用文 时间:2021-08-31 手机版

3、搜索引擎产品介绍

  搜索引擎产品其实包括很多种类, 并不限于我们最熟悉的全网搜索引擎。具体包含如下几种:

  ●全网搜索:包括市场份额最高的几大搜索引擎巨头, 如Google、Yahoo、Bing.

  ●中文搜索:在中文搜索市场中, 百度一家独大, 其他几家如搜狗、搜搜、有道的市场份额相对还比较小。全网搜索和中文搜索属于传统的搜索引擎, 它们经过了十几年的发展, 目前在技术和产品上都已走向逐渐稳定和成熟, 通用搜索的市场也基本进入饱和, 不像早些年一直呈现高增长率。

  ●垂直搜索:传统搜索引擎稳定成熟的同时, 在各个垂直领域, 也出现了很多和产品结合得很好的垂直搜索产品, 比如淘宝的购物搜索、大众点评的美食搜索、去哪儿和酷讯的旅游搜索等, 也都在各自领域占据了相当大的市场, 成为除了通用搜索引擎之外的重要的用户入口。

  ●问答搜索:专注于为问句式提供有效的答案, 比如Ask.com;其他的如问答社区像Quora和国内的知乎, 应该也会往这方面发展。

  ●知识搜索:典型代表就是Wolfram Alpha, 区别于提供搜索结果列表, 它会针对查询提供更详细的整合信息。

  ●云搜索平台:为其他产品和应用提供搜索服务托管平台 (Saa S或是Paa S) , Amazon刚刚推出它的Cloud Search, Index Tank在被Linkedin收购之前也是做这项服务的。

  ●其他:比如Duck Duck Go, 主打隐私保护, 也有部分用户买账。

  各种搜索产品在各自领域都需要解决特定的技术和业务问题, 所以也可以建立相对通用搜索的优势, 来得到自己的市场和用户。在开源领域, 各种开源产品和解决方案也逐渐发展成熟, 通用搜索技术不再为大公司所专有, 中小企业能够以较低的成本实现自己的搜索应用。现在搜索引擎产品之间的竞争更多的在数据、应用方式和产品形态上, 在系统架构和基本算法上区分并不大。

  搜索引擎在未来发展上, 一是搜索将不仅仅以独立产品的形式出现, 更多的会作为搜索功能整合到更多的产品和应用中。在产品形态上, 基于传统的搜索引擎, 会演化出像推荐引擎、知识引擎、决策引擎等形式的产品, 更好地满足和服务用户需求。而搜索引擎所涉及和发展起来的各种技术, 会更广泛地应用到各种其他产品上, 比如自然语言处理、推荐和广告、数据挖掘等。

  总之, 搜索引擎对互联网技术和产品带来的影响是巨大的, 未来也仍将有很大的发展和应用空间。

4、搜索引擎未来发展的趋势

  搜索引擎的快速发展就是近15年发生的, 这与互联网的发展趋势密切相关。最近几年, 互联网在经过了Web2.0的市场培育阶段后, 迎来了以互联网用户的个性化和社交化为中心的趋势。同时, 移动设备的逐渐流行及两大趋势的融合, 催生了很多新型应用, 为了迎接和顺应这种趋势, 对搜索引擎来说, 也产生了新的挑战。

  (1) 社会化搜索

  随着Facebook的流行, 社交网络平台和应用占据了互联网的主流, 社交网络平台强调用户之间的联系和交互, 这对传统的搜索技术提出了新的挑战。

  传统搜索技术强调搜索结果和用户需求的相关性, 社会化搜索除了相关性外, 还额外增加了一个维度, 即搜索结果的可信赖性。对某个搜索结果, 传统的结果可能成千上万, 但如果处于用户社交网络内其他用户发布的信息、点评或验证过的信息则更容易信赖, 这是与用户的心里密切相关的。社会化搜索为用户提供更准确、更值得信任的搜索结果。

  国外的Dogpile等元搜索引擎能够得到发展和壮大, 主要得益于国外传统搜索过多, 并且企业实现共赢的理念, 但在国人思考的是如何把所有资源都掌握在自己手中, 百度、Google、Yahoo是不会看着自己在未来发展中落伍, 成为跟潮人, 现在这几家都在不断丰富自己的产品线, 并且触及社会化搜索, 来保证自己在这个行业中的地位。

  (2) 实时搜索

  随着微博的个人媒体平台兴起, 对搜索引擎的实时性要求日益增高, 我想这也是搜索引擎未来的一个发展方向。

  实时搜索最突出的特点是时效性强, 越来越多的突发事件首次发布在微博上, 实时搜索核心强调的就是“快”, 用户发布的信息第一时间能被搜索引擎搜索到。

  不过在国内, 实时搜索由于各方面的原因无法普及使用, 比如Google的实时搜索是被重置的, 百度也没有明显的实时搜索入口。

  (3) 移动搜索

  随着智能手机的快速发展, 基于手机的移动设备搜索日益流行, 但移动设备有很大的局限性, 比如屏幕太小, 可显示的区域不多, 计算资源能力有限, 打开网页速度很慢, 手机输入繁琐等问题都需要解决。

  目前, 随着智能手机的快速普及, 移动搜索一定会更加快速的发展, 所以移动搜索的市场占有率会逐步上升, 而对于没有移动版的网站来说, 百度也提供了“百度移动开放平台”来弥补这个缺失。

  (4) 个性化搜索

  个性化搜索主要面临两个问题:如何建立用户的`个人兴趣模型?在搜索引擎里如何使用这种个人兴趣模型?

  个性化搜索的核心是根据用户的网络行为, 建立一套准确的个人兴趣模型。而建立这样一套模型, 就要全民收集与用户相关的信息, 包括用户搜索历史、点击记录、浏览过的网页、用户E-mail信息、收藏夹信息、用户发布过的信息、博客、微博等内容。比较常见的是从这些信息中提取出关键词及其权重。

  为不同用户提供个性化的搜索结果, 是搜索引擎总的发展趋势, 但现有技术有很多问题, 比如个人隐私的泄露, 而且用户的兴趣会不断变化, 太依赖历史信息, 可能无法反映用户的兴趣变化。

  (5) 地理位置感知搜索

  目前, 很多手机已经有GPS的应用了, 这是基于地理位置感知的搜索, 而且可以通过陀螺仪等设备感知用户的朝向, 基于这种信息, 可以为用户提供准确的地理位置服务以及相关搜索服务。目前, 此类应用已经大行其道, 比如手机地图APP.

  (6) 跨语言搜索

  这方面做得最好的是Google, Google目前已经能提供多种语言之间的跨语言搜索, 比如搜索“麻省理工”, 排在第一位的则是麻省理工学院的主页。

  如何将中文的用户查询翻译为英文查询, 目前主流的方法有3种:机器翻译、双语词典查询和双语语料挖掘。对于一个全球性的搜索引擎来说, 具备跨语言搜索功能是必然的发展趋势, 而其基本的技术路线一般会采用查询翻译加上网页的机器翻译这两种技术手段。

  (7) 多媒体搜索

  目前, 搜索引擎的查询还是基于文字的, 即使是图片和视频搜索也是基于文本方式。那么未来的多媒体搜索技术则会弥补查询这一缺失。多媒体形式除了文字, 主要包括图片、音频、视频。

  多媒体搜索比纯文本搜索要复杂许多, 一般多媒体搜索包含4个主要步骤:多媒体特征提取、多媒体数据流分割、多媒体数据分类和多媒体数据搜索引擎。

  例如图片搜索, 一般的步骤为:第一步, 缩小尺寸;第二步, 简化色彩;第三步, 计算平均值;第四步, 比较像素的灰度;第五步, 计算哈希值 (详情可参见Google图片搜索的原理一文) .

  (8) 情境搜索

  情境搜索是融合了多项技术的产品, 上面介绍的社会化搜索、个性化搜索、地点感知搜索等都是支持情境搜索的, 目前Google在大力提倡这一概念。

  所谓情境搜索, 就是能够感知人与人所处的环境, 针对“此时此地此人”来建立模型, 试图理解用户查询的目的, 根本目标还是要理解人的信息需求。比如某个用户在苹果专卖店附近发出“苹果”这个搜索请求, 基于地点感知及用户的个性化模型, 搜索引擎就有可能认为这个查询是针对苹果公司的产品, 而非对水果的需求。


本文来源http://www.010zaixian.com/shiyongwen/2648029.htm
以上内容来自互联网,请自行判断内容的正确性。若本站收录的信息无意侵犯了贵司版权,请给我们来信(zaixianzuowenhezi@gmail.com),我们会及时处理和回复,谢谢.