您现在的位置:首页 » 产 品 » 全文检索
TopSearch全文检索系统
 
背景与挑战  

在Internet飞速发展的今天,企事业单位的非结构化文档(HTML、Word、PDF等)大量出现;传统的关系数据库缺乏对非结构化文档的检索;对于企事业单位的网站要提高访问量,内部的各种文件、OA系统等需要提供利用效率,则需增加实用的全文检索功能,以便快速获取信息。

 
产品概述  

TopSearch全文检索系统,融合了高效的全文检索引擎和非结构化文档(Word、HTML、PDF等)分析技术,可轻松实现本地文件系统检索和一个(或多个)网站的站内搜索;同时TopSearch内嵌Spider(网页抓取器),能定期监控网站上的信息变化情况,对发生变化的信息自动建立索引,能够对网页内容进行全文检索以及针对网页各类属性的特征检索。

 
产品特点  

• 极高的检索性能
      TopSearch在G级数据集合上达到亚秒级检索速度;支持大量的并发用户检索;增量索引,确保索引速度快;索引空间膨胀率<0.5 。

• 非结构化文档统一检索
      TopSearch可以支持检索静态网页、动态网页、文件系统的目录文件等;支持对各种格式化文档的检索(如PDF,Word,Excel,PPT等文件)。

• 增量索引和自动索引
      TopSearch采用增量更新方式对内容进行更新,即每次检查数据变化时,只对新添加或发生变化的数据进行更新,索引性能明显优于只能进行完全更新的系统。
      系统维护管理工具采用自动和人工两种方式,支持远程维护和管理,通过设置任务计划可以实现远程无人值守的维护更新托管方式。更新及时,可以达到分钟级自动监测,支持增量更新,确保检索最新的资料。

• 任意排序
      TopSearch 对于输出结果,可以根据字段进行排序,比如相关度、点击率、日期等,方便用户快速找到需要的资料;这是与 Google 、 Baidu 等搜索引擎重要区别的特征。
    系统默认排序按照相关度排序,相关度排序以检索词与网页的相关性为依据对检索结果排序,相关性是对词频、词位(词在文章中出现的位置)、以及文件大小等因素综合评价的结果;时间排序则可以保证把最新的数据优先输出。

• 全面支持WEB服务
      TopSearch系统全面支持Web服务,可以方便与各个系统(包括.NET系统)集成,100%满足企业、政府检索的需要;支持XML输出,可应用于RSS;开放的API,支持二次开发。

• 管理方便使用简单
      TopSearch采用B/S架构,维护管理端用浏览器即可,无需安装任何客户端。管理方便,对于数据库索引提供配置向导。检索显示模板任意定制,可视化编辑器。在配置好初始的数据源后,系统可以定时更新数据源中发生变化的信息,不需要人工干预。

 
产品应用  

• 站内搜索
      大部分网民在第一次访问一个网站的时候,往往是首先进行站内搜索,如果搜索结果没有他们想要的,则有13%的消费者会马上离开,去别的网站寻找。TopSearch可为网站建立一套站内搜索,方便用户在网站海量数据中快速查找信息。

• 垂直搜索引擎 
      目前,垂直搜索引擎正成为互联网发展的下一个热点。比如企业库搜索、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索。采用TopSearch,实时索引企业已有的资料库,并结合互联网信息抓取技术,成为构建垂直搜索引擎的基础。

• 企业搜索
      企业内部有各种文件、OA系统、客户关系管理系统等多种资料,采用TopSearch,为企业搭建统一的信息检索门户。

 
成功案例  

• 中华人民共和国驻纽约总领事馆
      • 廊坊人民广播电台
      • 中华通信集团公司

 
 推荐方案
 
政府官方网站群-门户技术分享
了解更多
 
 华汇在您身边
产品方案售前咨询一线通
 
电话及时回应
产品询价
E-mail 给我们


或即刻致电:

86-10-64603500

中科华汇1999-2007版权所有.京ICP备06069025号