当前位置:首页 >> 信息与通信 >>

文本检索中动态索引技术研究_论文

2 1 年 2月 0  1   韶 关学 院学报 ?自然 科学  J un lo h o u n Unv ri ?Nau a  ce c  o ra fS a  ̄ a   ie s y t tr l in e S Fe .01   b2 l Vo .2 1   3 No2 .  第 3 2卷  第 2   文本检 索 中动态 索引技术研究  张 华 ,童德 茂 , 红 飞  顾 ( 阜阳职业技术学院 工程科技学院 , 安徽 阜 阳 2 6 3 ) 3 0    1 摘 要 : 析 了 当前 信 息检 索 多是 建 立 在 语 词 匹配 基 础 上 的 搜 索 , 引库 不 断 增 大 , 索 时 间 长 等 问 题 . 分 索 搜 通过 对 文 本  检 索步 骤 和 索 引结 构 的研 究 表 明 , 引 结 构 是 决 定 文本 检 索 效 率 的 关键 . 出 对 动 态 索 引 结构 B 树 进 行 改 进 , 索 提 + 通  过 改进 减 少 了 索 引层 数 , 高 了检 索 速 度 , 提 降低 了索 引 存储 空 间 , 究 结果 对 改进 文 本 检 索效 率 具 有 积 极 意 义. 研   关 键词 : 本检索 :+ ; 态索引 文 B 树 动   中 围 分 类 号 :P 9 . T3 1   3 文献标识码 :  A 文 章 编 号 :o】— 3 8 2 1 ) 2 0 2 ~ 5 1 ( 5 4 (O 10 — 02 0    7 随着 信 息社会 的发 展 , 息 已经 成为重 要 的社会 资源 , 何将 信息 按一 定的 方式组 织 和存 储起来 , 信 如 并根  据信 息用 户 的需 要 找 出有关 信息 , 为亟 待解 决 的 问题 , 成 这就 是信 息 检索 . 信息 检索 中 , 本检 索是 信息  在 文 检索 的基 础 . 由文 本检 索步 骤( 图 1可 以看 出索引 库 是文本 检 索的核 心 , 见 ) 索引 库的存储 结构 直接决 定文本  检索 效率 . 由于 当前信 息 的增长 和淘 汰速 度不 断加 快 , 文 检索 的动 态性 能显 得非 常重 要口.十 是一 种树  全 ] 树 B 形、 多级 、 态 索引 [ 构 , + 动 3 1 结 B 树在 操作 中可 “ 动态 地 ” 进行 维 护 , 须 周期性 的重 新组织 文件 , 无 因此 , 文检  全 索索 引库多 采用 B 树结 构. + 通过 改进 B 树结 构 , 高文本 检 索效率 ∞] + 提 .   结 果  图 1 文本 检 索步 骤    图 2 3阶 B 树    + 1 B 树 的性 能    + 11 .  m 阶 B 树 的 结 构  + () 1 每个 节 点至 多有 m 个子 女 ;   () 2 每个 节点 ( 根外 ) .. m 2 有 个子女 ; 除  ̄d -/J .d     ’ () 3 根节 点 至少有 两个 子女 ;   ( ) A个 子女 的节点必有 A个 关键码 , 图 2所示 . 4有 如   由 图 2可知 B 树 中所 有关 键字 都按 递增 次 序从 左 到 右插 在叶 结点 上 , + 并用 指针链 接起 来 , B 树 中 在 +   收 稿 日期 :0 0 1 2   2 1 -j — 2 基金项 目: 安徽省优秀青年人才基金资助项 目(0 9 Q Z 1 ) 20 S R 2 6  作 者 简 介 : 华 (9 5 )女 , 徽 六 安人 , 阳职业 技 术学 院 T 程 科技 学 院 讲 师 , 士 , 张 17 ~ , 安 阜 硕 主要 从 事 文本 信息 检 索 的研究  2   动态 索引技 术研  ? 3? 2   数 据指 针 只存 储 在 树 的叶 结 点 中 , 因此 , 叶结 点 的结 构 与 内部结 点 的结构 是 不 同 的. 搜 索 字 段 是关 键  如果 字, 叶结 点 对每 个 搜索 字 段 的 值有 一个 入 口和一 个 指 向记 录的 指针 , 于非 关 键搜 索 字 段 , 针 指 向 附加  对 指 级 中的一个 块 , 这个块 中存 放 指 向数 据文件 的记录指 针.+ 的所 有关 键码都 出现在 叶子结 点上 , 面各 层  B树 上 结点 中的关 键码 是 孩子结 点 中最小 关键 码 的复 写.+ 的构造是 由下 而上 的 , 限定 了结 点 的大 小 , B树 m 自下 而  上地把 每个 结点 的最小 关 键码 复写 到上 一层 结点 中[  4 ’ . 12 + .  B 树的 检 索效 率  由文献 [ ] 知关键 字所 在结 点 在 B 树 中的层数 决定 B 树查找 效 率 的首 要 因素 . 设 m 阶 B 树 中包  4可 十 + 假 + 含 N个 关 键字 , B 树结 构 可知每 层 上最少 关 键字个 数如 表 l 示. 由 + 所   表 1 B 树性 能 分 析 表    + 设 a fC J由于 B 树 的关 键 码都 在 叶子结点 , = ,2 , , + 因此有 N ̄2 a即 : > xk   后 ̄lg 1 oo <   () 1  B 树 的构造 是 由下 而上 的 , 十 自下 而上地 把每 个 结点 的最小 关 键码 复写 到上 一层 结点 中.+ 的内部 结  B树 点关 键字都 是 叶结点 最小关 键 字 的复 写 , 向上增 长越 高 的关 键字复 写次数 越 多 , 由上 表可 得 B 树 中重 复存  + 储关键 字总 数 S= x + ak 1 2 2 一 ) …2/ , :  ̄lk 2 (一 ) a( 2+ a 1即   + k , - S= + l   k 工一  [叶 口     工一 “  ]   () 2  2 B 改进 树 的 性 能    + 21 + .

相关文章:
文本检索中动态索引技术研究_论文.pdf
文本检索中动态索引技术研究 - 分析了当前信息检索多是建立在语词匹配基础上的搜索
全文检索系统中动态索引技术的研究.pdf
全文检索系统中动态索引技术研究 - 全文检索是一种非常有效的信息检索技术,本文通过分析全文检索系统中静态索引技术的优缺点,以及影响动态性能的因素,提出一种基于...
全文检索系统中动态索引技术的研究_图文.pdf
全文检索系统中动态索引技术研究 - 计算机与数字工程 第3 5卷 全文检索系统 中动态索引技 术 的研究 郭琦娟 陈通 照 276)501 ( 中国石油大学 (东) 华...
全文检索系统中动态索引技术的研究_论文.pdf
全文检索系统中动态索引技术研究 - 全文检索是一种非常有效的信息检索技术,本文通过分析全文检索系统中静态索引技术的优缺点,以及影响动态性能的因素,提出一种基于...
有效支持全文本检索的XML索引技术研究_论文.pdf
有效支持全文本检索的XML索引技术研究 - 在XML文档上进行全文本检索已经成为
基于内容的图像检索中多维索引技术研究..doc
基于内容的图像检索中多维索引技术研究. - \\、、 竺竺: 基于内容的图像检索中多维索引技术研究 王猛. 张明 (上海海事大学信息工程学院,上海 200135 摘琴:基于...
基于内容图像检索中的一种动态多维索引方法_论文.pdf
基于内容图像检索中的一种动态多维索引方法 - 多维索引技术是基于内容检索的图像数据库的关键技术。SR-tree和X-tree是目前比较成熟有效的多维索引技术。为了提高多维...
全文检索技术研究与应用论文1.doc
全文检索技术研究与应用论文1_计算机软件及应用_IT/...非结构化数据的则是一些文本数据、图象声音等多 ...文章中的每一个词, 对每一个 词建立一个索引,...
搜索引擎分块索引技术研究_论文.pdf
,…… .… 搜索 引擎分块 索引技术研 究 田海 龙 ,缪新颖 ( 大连海 洋...抓取 的贞面,提取 贞耐中的文本信息 ,行做进一步处 检索 的核心 技术 之...
基于文本的图像检索与基于内容的图像检索技术的比较研究_论文_....pdf
基于文本的图像检索与基于内容的图像检索技术的比较研究 - 随着互联网的快速发展及各种数字化设备的普及,现代数字社会中的图像信息的数量在迅猛增长,图像信息的检索...
基于内容图像检索中的索引技术.pdf
首先总结了基于内容图像检索中索引技术研究现状 , ...必然需要一种 标注进行的基于文本的图像检索技术已经...(3)大多数索引结构不支持数据库的动态更新 , 或者...
全文检索系统中动态索引技术的研究_论文.pdf
全文检索系统中动态索引技术研究 - 全文检索是一种非常有效的信息检索技术,本文通过分析全文检索系统中静态索引技术的优缺点,以及影响动态性能的因素,提出一种基于...
基于文本的索引构建技术.ppt
知识管理在企业竞争情报研究中的应用 管理信息系统中文化行为研究 企业竞争情报...文本检索中动态索引技术... 暂无评价 5页 2.00 文本检索的索引技术 22页...
R树动态索引在基于内容的图像检索中的应用.doc
R树动态索引在基于内容的图像检索中的应用 - R 树动态索引在基于内容的图像检索中的应用 摘要:数字图像数据量的急剧增张使传统的基于文本的图像检 索技术越来越...
高中信息技术教学论文 中文全文信息检索系统中索引项技....doc
高中信息技术教学论文 中文全文信息检索系统中索引技术及分词系统的实现_初二英语...包含在 应用程序中的代码只能在一个程序中使用,而在动态连接库中的代码则可以...
概率潜在语义检索模型中中文索引技术的比较研究_论文.pdf
概率潜在语义检索模型中中文索引技术的比较研究 - 概率潜在语义检索模型使用统计的方法建立“文档潜在语义一词”之间概率分布关系并利用这种关系进行检索。本文比较了...
基于内容图像检索的关键技术研究_论文.pdf
基于内容图像检索的关键技术研究 - 基于文本的图像检索技术 20世纪70年代末期,基于文本的图像检索技术(text-based image retrieval)是将图像作为数据库中存储的一个...
图像搜索引擎的存储与索引技术研究与实现.pdf
华中科技大学 硕士学位论文 图像搜索引擎的存储与索引...针对上述缺陷,研究了 Web 图像中文本语义和图像视觉...自适应模糊聚类及其动态层次索引树具有动态灵活、不依...
基于合并因子的多种格式文件索引技术_论文.pdf
为了改进传统的文本检索技术存在检索文件格式种类单一,索引大数据量文件速度慢,甚至造成内存溢出等问题,基于Lucene系统及相关技术,研究了基于合并因子的多种格式文件...
基于索引技术的网络数据检索优化的研究与应用--05级陶雨丰.doc
Web文本数据挖掘关键技术及... 3页 免费 网络音频...毕业论文 基于索引技术的网络数据检索优化的研究与 ...动态摘要、 DailyRefresh、 网页快照、多文档格式支持...
更多相关标签: