• 打印
  • 收藏
收藏成功
分享

一种新型高效全文检索引擎的设计


打开文本图片集

关键词:倒排索引;全文检索;检索引擎;模糊查询;字典树

0 引言(Introduction)

全文检索是指根据字符串在大量文档中找到与该字符串匹配的文档集合,常规文档管理手段基于文档遍历,查询效率极低,因此全文检索引擎研究对构建高效、智能的信息检索系统,提高信息处理能力具有重要的意义。

文档管理系统通常使用关系型数据库,模糊查询使用“like”配合“%”关键字,索引类型为“B-树(Oracle)”“B+树(MySQL)”等[1],前者会进行大量磁盘I/O [2],后者也会进行4次磁盘I/O,并且高并发时会占用大量内存[3]。(剩余4030字)

网站仅支持在线阅读(不支持PDF下载),如需保存文章,可以选择【打印】保存。

畅销排行榜
monitor