当前位置:首页 >> 信息与通信 >>

文本检索中动态索引技术研究_论文

2 1 年 2月 0  1   韶 关学 院学报 ?自然 科学  J un lo h o u n Unv ri ?Nau a  ce c  o ra fS a  ̄ a   ie s y t tr l in e S Fe .01   b2 l Vo .2 1   3 No2 .  第 3 2卷  第 2   文本检 索 中动态 索引技术研究  张 华 ,童德 茂 , 红 飞  顾 ( 阜阳职业技术学院 工程科技学院 , 安徽 阜 阳 2 6 3 ) 3 0    1 摘 要 : 析 了 当前 信 息检 索 多是 建 立 在 语 词 匹配 基 础 上 的 搜 索 , 引库 不 断 增 大 , 索 时 间 长 等 问 题 . 分 索 搜 通过 对 文 本  检 索步 骤 和 索 引结 构 的研 究 表 明 , 引 结 构 是 决 定 文本 检 索 效 率 的 关键 . 出 对 动 态 索 引 结构 B 树 进 行 改 进 , 索 提 + 通  过 改进 减 少 了 索 引层 数 , 高 了检 索 速 度 , 提 降低 了索 引 存储 空 间 , 究 结果 对 改进 文 本 检 索效 率 具 有 积 极 意 义. 研   关 键词 : 本检索 :+ ; 态索引 文 B 树 动   中 围 分 类 号 :P 9 . T3 1   3 文献标识码 :  A 文 章 编 号 :o】— 3 8 2 1 ) 2 0 2 ~ 5 1 ( 5 4 (O 10 — 02 0    7 随着 信 息社会 的发 展 , 息 已经 成为重 要 的社会 资源 , 何将 信息 按一 定的 方式组 织 和存 储起来 , 信 如 并根  据信 息用 户 的需 要 找 出有关 信息 , 为亟 待解 决 的 问题 , 成 这就 是信 息 检索 . 信息 检索 中 , 本检 索是 信息  在 文 检索 的基 础 . 由文 本检 索步 骤( 图 1可 以看 出索引 库 是文本 检 索的核 心 , 见 ) 索引 库的存储 结构 直接决 定文本  检索 效率 . 由于 当前信 息 的增长 和淘 汰速 度不 断加 快 , 文 检索 的动 态性 能显 得非 常重 要口.十 是一 种树  全 ] 树 B 形、 多级 、 态 索引 [ 构 , + 动 3 1 结 B 树在 操作 中可 “ 动态 地 ” 进行 维 护 , 须 周期性 的重 新组织 文件 , 无 因此 , 文检  全 索索 引库多 采用 B 树结 构. + 通过 改进 B 树结 构 , 高文本 检 索效率 ∞] + 提 .   结 果  图 1 文本 检 索步 骤    图 2 3阶 B 树    + 1 B 树 的性 能    + 11 .  m 阶 B 树 的 结 构  + () 1 每个 节 点至 多有 m 个子 女 ;   () 2 每个 节点 ( 根外 ) .. m 2 有 个子女 ; 除  ̄d -/J .d     ’ () 3 根节 点 至少有 两个 子女 ;   ( ) A个 子女 的节点必有 A个 关键码 , 图 2所示 . 4有 如   由 图 2可知 B 树 中所 有关 键字 都按 递增 次 序从 左 到 右插 在叶 结点 上 , + 并用 指针链 接起 来 , B 树 中 在 +   收 稿 日期 :0 0 1 2   2 1 -j — 2 基金项 目: 安徽省优秀青年人才基金资助项 目(0 9 Q Z 1 ) 20 S R 2 6  作 者 简 介 : 华 (9 5 )女 , 徽 六 安人 , 阳职业 技 术学 院 T 程 科技 学 院 讲 师 , 士 , 张 17 ~ , 安 阜 硕 主要 从 事 文本 信息 检 索 的研究  2   动态 索引技 术研  ? 3? 2   数 据指 针 只存 储 在 树 的叶 结 点 中 , 因此 , 叶结 点 的结 构 与 内部结 点 的结构 是 不 同 的. 搜 索 字 段 是关 键  如果 字, 叶结 点 对每 个 搜索 字 段 的 值有 一个 入 口和一 个 指 向记 录的 指针 , 于非 关 键搜 索 字 段 , 针 指 向 附加  对 指 级 中的一个 块 , 这个块 中存 放 指 向数 据文件 的记录指 针.+ 的所 有关 键码都 出现在 叶子结 点上 , 面各 层  B树 上 结点 中的关 键码 是 孩子结 点 中最小 关键 码 的复 写.+ 的构造是 由下 而上 的 , 限定 了结 点 的大 小 , B树 m 自下 而  上地把 每个 结点 的最小 关 键码 复写 到上 一层 结点 中[  4 ’ . 12 + .  B 树的 检 索效 率  由文献 [ ] 知关键 字所 在结 点 在 B 树 中的层数 决定 B 树查找 效 率 的首 要 因素 . 设 m 阶 B 树 中包  4可 十 + 假 + 含 N个 关 键字 , B 树结 构 可知每 层 上最少 关 键字个 数如 表 l 示. 由 + 所   表 1 B 树性 能 分 析 表    + 设 a fC J由于 B 树 的关 键 码都 在 叶子结点 , = ,2 , , + 因此有 N ̄2 a即 : > xk   后 ̄lg 1 oo <   () 1  B 树 的构造 是 由下 而上 的 , 十 自下 而上地 把每 个 结点 的最小 关 键码 复写 到上 一层 结点 中.+ 的内部 结  B树 点关 键字都 是 叶结点 最小关 键 字 的复 写 , 向上增 长越 高 的关 键字复 写次数 越 多 , 由上 表可 得 B 树 中重 复存  + 储关键 字总 数 S= x + ak 1 2 2 一 ) …2/ , :  ̄lk 2 (一 ) a( 2+ a 1即   + k , - S= + l   k 工一  [叶 口     工一 “  ]   () 2  2 B 改进 树 的 性 能    + 21 + .

相关文章:
文本检索中动态索引技术研究_论文.pdf
文本检索中动态索引技术研究 - 分析了当前信息检索多是建立在语词匹配基础上的搜索
全文检索系统中动态索引技术的研究_论文.pdf
全文检索系统中动态索引技术研究 - 全文检索是一种非常有效的信息检索技术,本文通过分析全文检索系统中静态索引技术的优缺点,以及影响动态性能的因素,提出一种基于...
全文检索系统中动态索引技术的研究_图文.pdf
全文检索系统中动态索引技术研究 - 计算机与数字工程 第3 5卷 全文检索系统 中动态索引技 术 的研究 郭琦娟 陈通 照 276)501 ( 中国石油大学 (东) 华...
有效支持全文本检索的XML索引技术研究_论文.pdf
有效支持全文本检索的XML索引技术研究 - 在XML文档上进行全文本检索已经成为
文本检索的索引技术_图文.ppt
? 背景和概念 文档分析 索引创建 索引查询 相关资料 1。背景和概念-索引作用 ...文本检索中动态索引技术... 暂无评价 5页 2.00 信息检索技术 第五章...
全文检索技术研究与应用论文1.doc
全文检索技术研究与应用论文1_计算机软件及应用_IT/...非结构化数据的则是一些文本数据、图象声音等多 ...文章中的每一个词, 对每一个 词建立一个索引,...
WEB中文本信息检索的关键技术研究.doc
WEB中文本信息检索的关键技术研究 - 龙源期刊网 http://www.qikan.com.cn WEB 中文本信息检索的关键技术研究 作者:刘晓星 胡畅霞 来源:《硅谷》2011 年第 16...
基于内容的图像检索中多维索引技术研究..doc
基于内容的图像检索中多维索引技术研究. - \\、、 竺竺: 基于内容的图像检索中多维索引技术研究 王猛. 张明 (上海海事大学信息工程学院,上海 200135 摘琴:基于...
全文检索系统中动态索引技术的研究_论文.pdf
全文检索系统中动态索引技术研究 - 全文检索是一种非常有效的信息检索技术,本文通过分析全文检索系统中静态索引技术的优缺点,以及影响动态性能的因素,提出一种基于...
基于BWC的XML文本数据索引技术研究_论文.pdf
基于BWC的XML文本数据索引技术研究 - 在XML文档中,相当大的部分是由文本数据组成的,针对XML文本数据占用空间较大、对压缩文本数据有效搜索效率较低的难点,基于BWC...
基于索引技术的网络数据检索优化的研究(毕业论文-范本).doc
基于索引技术的网络数据检索优化的研究(毕业论文-范本) - ***大学本科毕业论文 基于索引技术的网络数据检索优化研究 院(系)名称: 专业名称学生姓名指导教师:...
基于内容图像检索中的一种动态多维索引方法_论文.pdf
基于内容图像检索中的一种动态多维索引方法 - 多维索引技术是基于内容检索的图像数据库的关键技术。SR-tree和X-tree是目前比较成熟有效的多维索引技术。为了提高多维...
基于内容图像检索中的索引技术.pdf
首先总结了基于内容图像检索中索引技术研究现状 , ...必然需要一种 标注进行的基于文本的图像检索技术已经...(3)大多数索引结构不支持数据库的动态更新 , 或者...
一种动态更新索引结构的设计与实现_论文.pdf
一种动态更新索引结构的设计与实现_专业资料。在全文检索中,要使索引具有较好的灵活性,就需有合适的索引结构及更新策略,使得既能有效地实现索引更新,又不影响查询...
基于文本的索引构建技术.ppt
知识管理在企业竞争情报研究中的应用 管理信息系统中文化行为研究 企业竞争情报...文本检索中动态索引技术... 暂无评价 5页 2.00 文本检索的索引技术 22页...
基于时间戳索引的日志文件并行检索技术研究_论文.pdf
基于时间戳索引的日志文件并行检索技术研究_信息与通信_工程科技_专业资料。对...文本检索中动态索引技术... 120人阅读 5页 2.00 2018 Baidu |由 ...
搜索引擎的混合索引技术.pdf
论文在天网搜索引擎的实践基础上,提出了一种基于倒排文件实现的混合索引的方法,...人们在倒排文件 索引技术上做了大量研究。 文献 .%/中介绍倒排索引的几种...
基于合并因子的多种格式文件索引技术_论文.pdf
为了改进传统的文本检索技术存在检索文件格式种类单一,索引大数据量文件速度慢,甚至造成内存溢出等问题,基于Lucene系统及相关技术,研究了基于合并因子的多种格式文件...
...学年论文基于移动Agent的网络信息检索技术研究.doc
移动Agent的网络信息检索技术研究,学年论文,毕业论文...此种系统还能 对文本资料进行语言学意义的理解,当用户...建立索引数据库?在索引数据库中 搜索排序。当用户...
信息检索论文-文本表示模型.doc
信息检索论文-文本表示模型_信息与通信_工程科技_专业资料。文本表示模型摘要:在...等技术来辅助用户 和文档的表示,并且产生一些研究用的原型系统(如潜在语义索引...
更多相关标签: