中企共赢--提供顶尖的互联网品牌营销服务
最新动态

热烈庆祝中企共赢网络技术有限公司[山东SEO团队]与中国澳柯玛集团正式签定网络营销合作协议,近日山东SEO团队成员将赴青岛澳柯玛总部进行营销培训和技术指导工作,然后对双方预定SEM效果方案进行全面实施!

  • Search Frontier China


全文检索系统
随着信息量的爆炸性增长,建立高效的信息管理系统已成为越来越多用户的迫切需求。其目标是为用户的信息资源提供自动采集、数据分析、加工分类、建立索 引数据库以及全方位检索功能,它具有灵活的配置特性和高可扩展特性,可满足不同用户对于建立信息服务系统的要求。
全文检索基础件特色功能
多级组配检索技术
1)支持基元检索:对给定的检索串作为一个基本单元,直接在索引库的分词结果中有这个独立单元,那么会准确检索到结果,否则搜不到结果。
例如:检索:电
检索结果可命中:节约用电
不能命中:电灯、电话、电视机。
因为电灯、电话、电视机本身是基本单元。"电"不是一个基本单元
注:此种检索方式不支持输入的检索字符串超过一个词典词。
例如:检索:开拓创新、看电视
不能检索到任何结果。
2)支持复元检索:对给定的检索串进行分词,得到字典词和非字典词,把字典词作为基本单元检索,把非字典词拆成单字,每个单字都作为基本单元进行检索,最后的检索结果进行"与"操作,要求所有基本单元顺序和位置与其在检索串中的一致。
例如:如检索:国庆同志(分词结果:国庆,同志)
检索结果可命中:王国庆同志、刘国庆同志,因为其分词结果为王(刘),国庆,同志
检索:国庆同(分词结果:国庆,同)
不能命中:王国庆同志、刘国庆同志
检索:济南人民(分词结果:济南,人民)
检索结果可命中:济南人民很不错。
不能命中:济南的人民很不错。因为位置不一致,济南和人民不相邻。
3)支持组配检索:对给定的检索串进行分词,得到字典词和非字典词,把字典词作为基本单元检索,把非字典词分别拆成单字,每个单字都作为基本单元检索,最后结果进行"与"操作,要求所有非字典词内的基本单元(即单字)顺序和位置与其在检索串中的一致,要求非字典词、字典词之间的顺序与它们在检索串中一致,但不要求它们位置一致。
例如:如检索:国庆同志(分词结果:国庆,同志)
检索结果可命中:王国庆是个好同志、刘国庆同志(分词结果中有:“国庆”,也有“同志”且“国庆”在前,“同志”在后)
检索:济南人民
检索结果可命中:济南人民很不错、济南的人民很不错。
检索:中国日本
检索结果可命中:中国许多人觉得日本很有前途。
不能命中:日本许多人觉得中国很有前途。因为顺序不一致。
4)支持扩展组配检索:对给定的检索串进行分词,得到字典词和非字典词,把字典词作为基本单元检索,把非字典词分别拆成单字,每个单字都作为基本单元检索,最后结果进行"与"操作,要求所有非字典词内的基本单元顺序和位置与它们在检索串中的一致,不对字典词与非字典词的位置和顺序作要求。
例如:如检索:国庆同志
检索结果可命中:王国庆是个好同志、刘国庆同志、有个同志名叫国庆
检索:中国日本
检索结果可命中:中国许多人觉得日本很有前途、日本许多人觉得中国很有前途
5)支持英文检索:可以对文本内容为英文或中英文混排的文本进行检索。
支持逻辑检索:可以同一短句内(此项功能目前市场上只有海量可以提供)、同一篇章内进行与、或、非、逻辑关系检索。
6)支持表达式检索:可以表达式方式进行多个词的与、或、非检索。例如:“海量+科技+天津”。
7)支持中英文混合检索:可以用复元检索、组配检索、扩展组配检索进行中英文混合检索。例如:检索“海量科技Hylanda”。
8)支持整句检索:也可以检索整个句子。例如“天津是个美丽城市”。
9)支持检索结果按照词频排序输出:检索时可以计算检索词的词频,并在输出检索结果时根据词频排序。
10)支持检索结果按照相关度排序输出:检索时可以计算检索词与命中篇章主题的相关度,并在输出检索结果时根据相关度排序。
11)可以处理带格式的文本
例如:<标题>全文检索软件包说明书
<作者>海量科技
<正文>全文检索软件包是一个…
可以对<标题>、<作者>、<正文>分别建立索引,以供检索。
12)支持的数据格式:为了保证软件包核心的内聚性,本SDK只支持.txt文件。(MS OFFICE、.html、.htm、.pdf等格式的文本可利用本公司提供的插件处理后再进行索引。插件不属于此软件包)。
13)支持数字检索:可以对文本中的数字进行检索。(体验版不支持此功能)
14)支持GBK:支持GBK,但是对特殊符号不进行索引。
15)支持Unicode:软件包分为Ansi版和Unicode版。Ansi版可以索引Ansi编码方式的文本;Unicode版可以索引Unicode编码方式的文本和Ansi编码方式的文本。(体验版不支持此功能)
检索结果精确定位到句技术
精确到句检索技术是海量全文检索功能基础件特色功能,解决了类似检索中国北京查不到中国首都北京的难题,同时也在检索结果中过滤了许多不相关的信息,使检索结果的相关度、查准率、查全率等指标有很大提升,让用户能得到真正想要的信息。全文检索基础件采用海量智能分词、动态最优存储、变帧压缩法等专有技术保证了检索速度快、低数据膨胀率的同时实现了精确到句的检索功能,是全文检索技术的一个大的突破。
索引检索并行技术
索引检索并行是指在索引库用于检索的同时,可以追加索引记录(即边建边搜)。全文检索基础件采用精确的同步技术,内部屏蔽了数据的互斥操作,在只采用一份索引库的前提下实现了索引和检索的并行,让用户对索引库的操作更加方便。
数据灾难保护技术
数据灾难保护是指对意外情况(如断电、死机等)造成数据损坏的修复技术。全文检索基础件提供了强大的灾难数据保护功能,对灾难数据可以进行全面检查和自修复,使索引数据更加安全,让数据维护工作更加简单.
全文检索基础件应用领域
1)网站发布系统;
2)数字图书馆、信息中心建设;
3)电子政务系统;
4)企业信息门户

中企共赢总机 公司总机: 0531-85605582 
中企共赢业务电话 业务电话: 0531-82070022 
中企共赢业务电话 技术热线: 013156113617 
济南网络营销 公司传真: 0531-85994199
在线留言
qq在线留言
济南网站优化

Search Frontier LTD.