最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 正文

OES_搜索引擎采购指南

来源:动视网 责编:小OO 时间:2025-09-25 07:04:51
文档

OES_搜索引擎采购指南

OpenfindEnterpriseSearch产品搜索引擎采购指南企业真的需要搜索引擎吗?『搜索』,是一个很简单的概念。透过互联网,使用者只要输入一个关键词并按下Enter键,系统就会自动地将符合的结果列出,即使面对的是数千万的网页,入口网站依然在一秒内就完成查询。这样看似简单的一个功能,让许多企业都想要拥有,但是当公司真要导入时,却发现系统的复杂度远超过先前的想象,常会因为评估期过程太长而导致项目无疾而终。对多数的企业来说,在购买搜索引擎时的出发点都很简单,往往只是要解决几个典型的问
推荐度:
导读OpenfindEnterpriseSearch产品搜索引擎采购指南企业真的需要搜索引擎吗?『搜索』,是一个很简单的概念。透过互联网,使用者只要输入一个关键词并按下Enter键,系统就会自动地将符合的结果列出,即使面对的是数千万的网页,入口网站依然在一秒内就完成查询。这样看似简单的一个功能,让许多企业都想要拥有,但是当公司真要导入时,却发现系统的复杂度远超过先前的想象,常会因为评估期过程太长而导致项目无疾而终。对多数的企业来说,在购买搜索引擎时的出发点都很简单,往往只是要解决几个典型的问


Openfind Enterprise Search 产品

搜索引擎采购指南

企业真的需要搜索引擎吗?

『搜索』,是一个很简单的概念。透过互联网,使用者只要输入一个关键词并按下Enter键,系统就会自动地将符合的结果列出,即使面对的是数千万的网页,入口网站依然在一秒内就完成查询。

这样看似简单的一个功能,让许多企业都想要拥有,但是当公司真要导入时,却发现系统的复杂度远超过先前的想象,常会因为评估期过程太长而导致项目无疾而终。

对多数的企业来说,在购买搜索引擎时的出发点都很简单,往往只是要解决几个典型的问题:

1.在企业网站中提供搜索功能。

2.公司内数据越来越多难以管理,且储存在不同计算机内。

3.离职员工的文件数据已完成备份,但想使用时却难以调阅。

4.特定项目进行时,同一份文件需要重复的提供给不同的人。

5.不同部门对内部文件都有自己的管理方式,难以整合。

上述的问题看来简单,但当IT人员真的跟厂商洽谈时,却发现系统导入时要注意的事情越来越多,却没有一个明确的作法,导致企业会花两、三个月的时间评估,却买了一套不太合用的搜索引擎回来。

本文将以企业的需求为出发点,分析几种常见的状况及思考方向,希望给企业一个比较清楚地概念,藉此节省评估时间并简化导入流程,以解决企业内部的信息分享问题。

采购前应该先注意些什么?

企业在导入搜索引擎之前,必须先了解搜索引擎在产品定位上是一个加值产品,而非一个全能的产品。它需要架构在现有的系统上,透过产品内的检索功能去改善企业内部的分享流程,以减少内部资源的耗损。对企业来说,善用搜索引擎工具,可以明显提高企业内知识的重复使用率。

搜索引擎像是一扇任意门,可以大幅缩减人与目标数据之间的距离,减少土法炼钢找数据的时间浪费,而这扇任意门要运作的好,管理者必须给予搜索引擎正确的方向与良好的规划。企业内部的多数数据都尚未结构化,一般来说仅具备时间、

思进行系统分析,这一点与入口网站所提供的搜索服务不同,

引擎企业来进行数据分享,那下列事项是管理者需要思考的:

1.了解企业内部需求

如之前所说,多数企业对搜索引擎的初步想法都很简单,但实际上系统的导入难度通常是与企业的信息化程度及作业复杂度成正比,这部分通常会因产业作业特性不同而有差异,以下是比较常见的产业数据储存特性:

制造业

工作流程定义明确,多数会依照SOP进行操作。

窗体作业繁复,各个产品线都有专属的窗体格式。

数据多储存于数据库,故搜索行为接近数据库搜索概念,而非一般关键词搜索概念。

部分产品同构型高,故在索引库规划时需要善用View及Group概念。

单位

数据因具备公文格式,故在管理上比较有脉络可行。

文件成长速度快,需要具备扩充性强的系统。

许多网页或文件均具有机密性,需要做好事前防制及事后稽核。

多数数据均需要定期备份,以供相关单位调阅及查询。

金融业

企业内所有系统都是以『稳定』作为首要诉求。

数据多以网页及数据库方式进行储存。

内部信息系统繁多,故系统需具备客制化开发弹性。

因考虑各式数据的控管及安全性,需提供File Level的权限设定。

高科技业

单位与组织庞大,不同部门之间的数据储存方式与差异性大。

内部信息系统繁多,故系统需具备客制化开发弹性。

重视信息安全性,对研发及制程的相关数据特别重视。

少数公司需提供两岸三地的文件流动及搜索服务。

重视信息交换的实时性。

传统产业

电子化程度不高。

数据多以非结构化方式储存。

信息的所有权多数存在特定人员的计算机中。

文件储存量相较其它产业为低。

信息多以文件方式储存。

2.分析企业内数据管理方式

企业在导入搜索前,必须先了解公司内部的数据分布特性。了解的数据的分布状况后,才能知道要如何应用搜索引擎把这些被埋没的有价信息找出来,并达到共享与流通的目的。通常可以将企业内部的文件,依照储存与管理方式的不同,分为三大类:

结构化数据

多数放置于数据库内部的数据都已经具备某种程度的关连性,故归类于

结构化数据。对搜索引擎来说,结构化的数据在搜索时会比较好处理,

一方面是因为数据比较不会有重复的问题,另一方面则是不同Record

之间的关联性,可透过数据库内附的一些功能去建置。

半结构化数据

企业中有许多文件会依照特定的目录架构进行储存,或是透过其它的应

用软件进行存放与管理(如:File Server),这类型的数据因为已经具备

初步的规划与管理,所以在搜索引擎导入时,可以套用企业现有的分类

管理架构,可以减少企业在导入时的人力支出。

非结构化数据

一般来说,这部分指的就是散落在企业内部的其它数据,因为数据大多

以文件的型态存在于员工的个人计算机中,所以在管理上的困难度很

高。但是这些数据通常是企业内最有价值的隐性资产。

3.进行企业内部的信息成长预估

对多数的组织来说,每一次的信息采购投入的人力及资金成本均相当的高,导入系统之后,往往在三至五年内均不会进行系统更换。在此建议管理者在采购搜索引擎前,必须先预估未来三年的数据成长量、硬件承载量及软件扩充性,减少重复采购所造成的浪费。

数据成长量

在预估数据成长量之前,必须先确认未来搜索引擎所要抓取的数据标的

为何。若抓取标的为内外部的网页数据,那数据的成长幅度并不大,正

常来说几乎不会超过一万笔;若抓取的标的为日常工作文件,则数据的

成长量则会比较大,实际的数字可以透过每周或每月的数据产出量来进

行估算。

硬件承载量

目前市面上的搜索引擎,其硬件需求多为PC Server等级,除非在数据

量或是查询量有特别需求的客户,才会需要去选择比较高等级的服务

器。

软件扩充性

在软件采购的过程中,

为在大多数的评估流程内,会着重于当下的系统及压力测试,

软件的扩充度上,却很容易被忽略。若是于系统评估时,

素,那未来系统要与其它环境进行整合的时候,

4.投入成本评估

在搜索引擎的导入过程中,因为系统大小的不同其投入的成本也会不同。这部分的成本除了软件的购买成本外,也需要把内部的人力成本一并估算,以目前地区的搜索引擎导入案来看,从五万至上千万都有可能,一般来说,投入的金额会与组织大小及数据量成正比,故于系统采购时,可以先抓出一个大略的预算再进行访价,一方面可避免花费过多的预算;另一方面也避免以过低的价格买到不完整的产品。

由上图中可以看到,对中小型企业来说,90%的需求都直接可以采购厂商的标准产品;对于大型企业来说,则会有客制功能的需求,而客制的费用通常会是整个导入案的二到三成左右。

什么是符合企业需求的搜索引擎?

在经过了完整的事前准备与信息搜索后,管理者通常会进入第二阶段:系统的评估与测试。

对每一个企业来说,因为数据存放特性的差异,故在搜索引擎导入时都会有些许的不同,而这些差异点常常就是系统评估时的重点,通常企业在评估搜索引擎时,会以下列几个方向切入:

1.系统稳定

对IT人员来说,系统的稳定运作是基本需求。但实际上『稳定』对多数人来说,是一个相对性的概念,并非决定性的评估标准。通常对于提供给一般客户使用的不中断服务,对于系统的稳定要求是相当高的;但对于企业内一般部门使用的软件,其要求就会是情况而定。所以管理者在导入时,可依照现有的应用范围进行评估。

2.易于安装与设定

现行多数的应用软件在安装时都不需要复杂的操作步骤,故安装部分的问题通常不大。搜索引擎因产品特性的关系,通常会有比较详细的系统设定,故在导入时,需要了解该产品是否有详细的操作手册或是操作说明。若在系统设定时发生问题,也需要提供对应的窗口以供咨询。

3.产品效能

对搜索引擎来说,其产品效能主要有三个评估点:

数据分析

一般来说,系统在数据分析前会先进行数据的抓取动作,故这部分的所

花费时间通常会与网络的频宽有关,故不同厂商的产品如果要进行评

估,大多需要在现场进行测试才能确定。

数据查询

对多数的使用者来说,对搜索引擎查询速度的明显感受差异会在1-3秒

这个时间区间。当整个搜索时间低于1秒时,对使用者来说,只会有『快』

的感觉;当整个搜索时间高于3秒时,多数的使用者则无法再继续等待。

故建议企业在评估查询时间时,可以设定一个内部的标准,由此标准评

估查询速度即可。

数据排序

市面上所有的搜索引擎内部都有一套『符合程度』的计算公式,所以即

使是同样的数据,当透过不同的搜索引擎进行分析后,其排序出来的结

果也不尽相同。通常排序是否恰当,都是使用者的主观判断,故比较难

以用量化的数据来评量,这个部分建议可以透过使用者的测试来进行评

估。

4.售后服务质量

整合商及产品,以维持服务的质量。

当完成系统评估之后,通常会有1~3间的入选厂商,若是企业所要引进的系统比较复杂,则管理者可以针对系统进行下列的测试,以了解系统的细部需求是否能完全符合之前所开列的需求。

1.系统安装

一般来说,会建议测试时采用的软硬件环境与真实上线的环境相同,因为在面对不同的操作系统时,系统可能有需要微调的参数或设定,若是设定不同,可能会造成上线安装时的困扰。

2.数据抓取及整合测试

在测试阶段中,最重要的就是数据抓取的部分,因为企业内往往存在于不同时期所购买的数据储存环境,在实际数据抓取的时候可能会遇到兼容性的问题,面对特殊的数据交换格式或编码,可能都会造成数据抓取不全的问题,故在此阶段测试时需要特别慎重。

3.使用者测试

当系统可以成功完成数据的抓取及分析后,就可以开始测试其查询结果。

对多数的企业来说,对测试结果应该都觉得不错,但对部分企业来说,因为其提供检索的数据叫偏向特定专业,故会发现其搜索结果不是很符合需求。此时,管理者可以透过部分软件的词库调校功能,进行词库的增补,即可改善此问题。

4.评估报告

当测试完成后,可以撰写一份简易的测试报告,通常会包含下列几项讯息:

安装机器的软硬件环境

测试抓取目标

抓取时间

抓取数据量

平均搜索时间

查询笔数及实际数据笔数(需指定关键词)

当系统完成测试后,整个评估流程也就告一段落,接下来就可以进入正式导入的流程。

Openfind Information Technology, Inc. 如何让搜索引擎运作的更好?

当完成搜索引擎的导入后,企业还需要进行后续的维护与管理工作,以维持搜索引擎的服务质量。

1. 加强教育训练与倡导

使用者习惯通常是系统导入后最难掌握的部分,许多信息系统也因为内部习惯难以改变,而被打入冷宫。所以当系统在上线前,建议管理者邀请各使用单位的主管或相关人员进行一次初步的教育训练与功能解说,让内部同仁能先了解新系统的定位与操作方法,可以减少上线时的问题,同时也可增加大家的使用意愿。

2. 落实文件管理机制

对大部分的公司来说,重要的文件都会集中管理,所以对搜索引擎来说,通常也是连结到特定的档案服务器进行数据检索的更新。但是就以往的经验来看,部分企业虽然有管理机制,但却没有彻底执行,所以当搜索引擎进行数据分析时,会发现大多数的数据都已过时,也都失去了搜索的价值。

通常这些工作,很难是由IT 部门主导就能执行,因为很多是牵涉到内部同仁习惯与认知,故会需要与其它相关单位达成系统导入的共识,才能让系统产生效益。

联络信息:

网擎信息软件股份有限公司

网址:http://www.openfind.com/

地址:上海市浦东新区郭守敬路498号11号楼401室(张江软件园) 电话:+886-2-2369-7575

传真:+886-2-23-8738

E-mail: sales@openfind.com

文档

OES_搜索引擎采购指南

OpenfindEnterpriseSearch产品搜索引擎采购指南企业真的需要搜索引擎吗?『搜索』,是一个很简单的概念。透过互联网,使用者只要输入一个关键词并按下Enter键,系统就会自动地将符合的结果列出,即使面对的是数千万的网页,入口网站依然在一秒内就完成查询。这样看似简单的一个功能,让许多企业都想要拥有,但是当公司真要导入时,却发现系统的复杂度远超过先前的想象,常会因为评估期过程太长而导致项目无疾而终。对多数的企业来说,在购买搜索引擎时的出发点都很简单,往往只是要解决几个典型的问
推荐度:
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top