当前位置:首页 >> 信息与通信 >>

海量物联网差异数据定位识别建模仿真


第33卷第04期 文章编号:1006—9348(2016)04—0320—04

计算机仿真

2016年4月

海量物联网差异数据定位识别建模仿真
代恩华,喻学涛
(聊城大学东昌学院,山东聊城252000) 摘要:在物联网下的差异数据进行定位识别问题的研究中,由于大型物联网结构下的数据量很大,形成海

量的差异数据。上 述数据特征很难用统一标准进行衡量,使得定位识别需要的特征分区过多,导致传统的定位识别过程需要进行多次分类校 验,效率较低。提出采用不一致率的海量物联网差异数据识别模型,首先统计样本数据在每个特征子集划分下的频数表并 计算物联网数据不一致率,再根据特征子集对应的物联网数据不一致率差异最小化原则完成特征个数最小化的最优特征子 集筛选;然后由模糊优选模型得到有序综合指标特征数据集,最后采用聚类分析将有序综合指标数据集聚类为几个簇进而 完成物联网差异数据的定位识别。仿真结果表明,所提方法的识别定位速度和精度比传统方法有明显提高。 关键词:物联网;差异数据:特定区分;不一致率 中图分类号:Tit332 文献标识码:B

Modeling

and

Simulation of Location

and Identification for

Massive

Iot Difference Data

DAI En—hua.YU Xue—tao (Dongchang
College of Liaocheng University,Liaocheng Shandong

252000,China)

ABSTRACT:An identification model of massive difference data in the Intemet of things(10t)is put forward based
on

the rate of inconsistent.Firstly,the frequeney paaition table of sample data under the condition of each feature

subset is obtained,and the inconsistent data rate in Iot is calculated.According to the difference minimization prinei— pie of the inconsistent data rate in feature subset corresponds to the Internet of things,the optimal feature subset is selected to complete the minimized number of the characteristics.Then data sets with orderly comprehensive index characteristics
are

obtained by fuzzy optimization model,and the cluster analysis is used to the data clusters with the

orderly comprehensive index,SO as to complete the positioning and identification of the difference data in lot.The simulation results show that the proposed method pared with traditional methods.
can

obviously improve the identification speed and accuracy com-

KEYWOImS:Internet

of

things(IOT);Difference

data;Specific distinction;inconsistency rate

(RFID)、激光扫描器、全球定位系统等讯息传感设备,根据


引言
物联网是一个有传感标识器的智能感知讯息网络系统,

约定的条约,将任意物品和互联网衔接起来,实行讯息互换 与通信,以达成智能化辨别、跟踪、定位、监控及管制的一个 网络‘4|。 传统的海量物联网差异数据的定位辨别数学模型有基 于决策树归纳分类‘51、基于距离的物联网数据分类∞J、基于 概率关系模型的物联网数据分类一1和基于元组标识传播的 物联网数据分类方法¨o等,文献[9]提到的基于随机逻辑推 理物联网数据分类算法,数据视角更细致,可以更完整的反 应数据构造及取样概率分布情况,但这是一个整体实例的陈

加速了世界人和物、上物和物、人和自然间的对话和沟通…。 是在计算机、因特网及移动通讯网之后发展的一个新技术是 全球讯息化发展的新进程,达成了数字化到智能化的承接和 提高【2 J。这个技术会推进IT业打破性发展,激发世界第三 次产业化海潮,有着重要的科学意义及使用价值口1。当前较 为公认的物联网的定义为:红外感应器、经过射频辨别

基金项目:聊城大学东昌学院教科研立项(2015LG002) 收稿日期:2015—05—12修回日期:2015—10—28 .---——320.---——

列,抉择着其学习难度较大,所需时间较长。文献[10]中提 到的基于贝叶斯网络的数据分类方法,虽然可以较为快速的

万方数据

对海量物联网数据进行分类,但是其数据传输形式太严肃, 缺少对物联网关系数据库特这的思考。 提出一个基于不一致率的特点选取及间隔差异度组合 权重相组合的海量物联网差异数据的定位识别数学模型。 仿真结果表明,提出方法的分类速度和精度对比传统方法有 明显提高,证实了研究方法的可行性。

感器信息处理的负载均衡,不能在尽可能多的保留物联网原 始信息的基础上减少信息处理的数据量,无法保证提高物联 网应用系统的整体效率。 3.1基于不一致率的物联网差异数据特征选择 物联网差异信息数据的差异率能够将在一定区域内不 同属性的数据进行准确描述,不同区域内的不同发生的数据 信息进行不同类别的对待,多种计算方法会得到多种数据特

2物联网差异数据定位原理
海量物联网差异数据的定位识别过程是数据挖掘的基 础,它采用图来表示差异数据的区域,在通过特定的方法完 成识别过程,其原理如下: 假设有Ⅳ个关系数据则可表示为{(G.,Y.),(G2,Y:), …,(G。,n)},每个物联网差异数据用图G。=(K,E。)表示, 儿∈{+l,一1}表示其类别。 数据定位是使用数据讯息的数据搜查性能和自己的特 性,经过不停的学习及设置达成。其中数据与数据之间的关 联程度表示物联网数据的具体物体、边框表示不同具体物体 之间的关联属性。SUBDUE是用最小数据量来表述大小为 物联网数据差异评估函数,利用贪婪计算方法进行搜索,通 过反复的查找对数据信息进行最大程度筛选,压缩录入。初 始的数据有且仅有唯一一个点,通过对其相邻数据信息进行 扩展,得到该数据信息的扩展子数据信息,优于原始数据的 进行取代。 对物联网数据进行标识的原理就是将多维度空间的特 征集合进行差异标识,对于随机的一条物联网数据信息在多 维度空间中的差异数据是根据系统规则进行计算后确定的, 其特征计算公式应为 K(Gl,G2)=
‘hi,/*2 J

征分布,在对同一个数据信息采用不同计算方法得到不一致 率能够衡量特征计算系统对数据识别能力,不一致率越大则 表明系统运行的时间及复杂程度越大,特征的归类划分能力 就越差。 数据信息的特征区间划分如表1所示:
表1 P个特征划识别间模式下的数据类别频数表(L)
£ Pattern l 2





表1中^表示在物联网信息集合数据归属于以集合并
且数据属性属于L划分类别的数据数量,在整个物联网数据 信息中对于特征集S={一,t,…,凡}数据物联网信息差异 计算如下

∑(∑厶一max{厶{)

型—生L——二一

(3)

物联网差异数据信息的特征筛选过程就是从物联网集
EHt“1)xH(叼J



pGt(hi)PG2(h2)K(hi,h2)
(1)

合中对数据特征进行有效的筛选,将不同类别的数据进行划 分归类,通过对归类数据计算能力及程度进行级别区分。因 此,选择物联网数据信息高频数不~定代表算法具备更好的 辨别能力。同时,针对物联网数据讯息的离散频数能直接的 在计算里实行反映汇总统计。基于差异率条件下的高低频 比传统的数据信息统计方法更具有计算优势。 提出基于不一致率的物联网数据信息特征筛选方法。 假设z为物联网数据信息s的子特征集(zCS),占:表示物联 网基于数据信息频数表特征集z的数据差异率。基于最小 差异率的数据信息排列顺序应为: 1)假设物联网数据信息集合D包含有F.,,:,…,凡共 d个差异特征: 2)对物联网数据信息初始化,特征数据集最优算法为空 S={ }; 3)计算物联网数据信息s子集与每个特征数据信息组

对物联网数据特征进行解释的重点是数据特征,该特征 是系统在规则一定的情况下通过数据结点中的熵进行运算 后产生的数据集合,并根据该集合对所有数据进行树状的排 序,通过对树状结构内的各种数据进行筛选后得到最终的特 征数据信息,它是以特征核的形式进行表述,如式(2)所示

K(Gl’G:)=exp(1.0+已等)(2)

式(2)中,H(G)是物联网数据信息差异G集合,pG数据参数 的随机分配模型,托其中一个特征数据,用于系统对特征计 算的参照函数。两个数据信息相对独立,因此运算方法及路 径不同,通过多高维度空间创建的超维比较法来实现物联网 中数据信息的差异比较识别。


基于不一致率的物联网差异数据的定位识别建模
由于物联网数据自身所具有的海量性、异构性、时空敏

成的子集,该条件模型模式下物联网特征数据信息集合D的 差异率; 4)选取物联网信息数据最小差异率,。为最优算法筛选 子集,计算最优算法为S:fs,F。};

感性、动态流式等特性,传统的海量物联网差异数据的定位 识别数学模型在进行物联网数据分类时,无法保证各节点传

一321— 万方数据

5)根据物联网数据信息排列顺序,通过本文算法前向计 算搜索,可以得到特征数据个数排列由小到大的树形子集排 列表; 6)在物联网数据信息中,选取物联网特征个数小的小特 征数据集合z,s:一E或者s 7/£所有集合准确率不一致性 最小时,确定该算法为最优算法。 3.2基于距离差异度的组合赋权方法 为了解决在对物联网差异数据进行分析计算数据量过 大的问题,如何筛选出特征数据就是核心问题,特征数据参 数适合水平抉择了系统运行后续工作。特点参数算法一般 为主观及客观两类对物联网数据信息进行赋值方法。本文 提出的一种新的计算规则方法,在进行主观赋值时使用物联 网数据信息的最优值和最劣值之间的均数差分越大越好,能 够保证在进行最大划分时小差异和大差异的一次性计算完 成,可以免除因算法不同而导致选取算法在搜查结果里的不 统一,去除系统运行时的冗余。为了在运算中能够直观进行 表述,将属性、数据信息集合、及最大值和最小值集中在一个 x和】,的坐标中进行映射,如图1所示。

fMaxF-2荟荟苫仇%(h—o|_h一毋I’

t S,t.虹:?
“‘

@’

L0≤0}≤1,k=1,2,…,2

在对物联网数据信息进行计算筛选过程中尽量减少系 数0。的不均衡发展影响,根据最大熵原理,对特征组合系数 0。,取最大熵,即

fMaxFz=一∑0。1n0。
k5

k虹:1

∞’

【o≤篡Ⅲ-1,2,…。z
综合以上两个模型构造如下最优化模型:
m m



麟■

,扎。


∑㈦










—、

●R5.


,●(



、l/

n。∑㈦以



骆南,川 。




(7)

,,吣:
/, R4./。
, /


?? R3

式中,肛是物联网特征信息数据最优系数因子,在系统运行 中为了简化运行时间和复杂程度对Lagrange函数进行构造。 由于模糊优选模型及聚类解析算法的优缺点,提出基于






R1?

模糊优选模型和聚类解析算法的物联网差异数据辨别模型。 首先采用模糊优选模型对海量物联网差异数据集实行计算 获得对应优和次的一维有序整体指标数据集,使用聚类算法
物联网数据集二维平面映射图

.,B

图1

对一维有序整体指标数据集实行聚类;完成分类。该物联网 差异数据辨别算法不但补充了聚类方法处置高维数据的缺

设通过物联网数据信息P种数据参数主观赋值,能够计 算出在P个主观赋值参数睨=(∞¨∞亚,…,甜。),(s=1,2, …,P),通过Q种客观赋权法得到q个客观权重Wo=(∞。., ∞以,…,∞。),(o=1,2,…,P),上述公式中∞,,和∞d分别表示 物联网信息数据中特征主、客观参数,当计算条件满足

点,还去除了模糊优选区分的人为定界的不足。

4实验结果及分析
为了验证本文方法的有效性,需要进行一次实验,移动 传感器数据选取以北京10000辆出租车收集的实际GPS数 据的根本上经过一个数据模仿程序产生的,这个模仿程序经 过对初始GPS采样数据的插值与倍增,能够动态模拟12800 —32000个移动传感器的数据采样。静止传感器数据是镜柜

∑%=1,(s=1“2一,p)和∑%=1,(。=1,2,…,g)。
令W’=(∞j,甜f,…∞:)为上述z=P+q种,参数向量用公 式表述为


一个模仿程序随机产生的,这个模仿程序能够模仿出12800 (4) —32000个静止传感器的动态数据采集样品。把上面说的两 部分数据依据一定的比例实行合并,能够获得实验里所须要 的整体数据集。 本文选择错误率当作标准定位辨别结果,错误率是被错 误辨别的数目占的比例是数据集总数目的百分比,其计算公 式如下所示

叶4=∑巩‰,,=1,2,…,m


其中,0t表示权重组合系数,且∑以=1,巩≥0。
参数加权在广义角度上来说就是数据差异越大,越能够 体现特征的不同,数据差异越小,分类组合条件越好,为此构 造计算模型如公式所示

Error=旦×100


(8)

.--——322...——

万方数据

式中,s为被错误辨别的数据数量,n为数据集的数据总的 数量。 在数据集中随机选取三个子数据集,将本文提出方法与 贝叶斯分类方法和F0一CA方法进行对比实验。其结果如 图2所示。

5结束语
提出一种基于不一致率的特征选择和距离差异度组合 权重相结合的海量物联网差异数据的定位识别数学模型,首 先通过减少物联网数据初始区间数量改进Chi—Merge离散 化方法,统计样本数据在每个特征子集划分下的频数表,并 根据频数表计算物联网数据不一致率,再利用顺序前向最优 搜索的方法,快速确定特征数量由小到大的每一个最优特征 子集,根据特征子集对应的物联网数据不一致率差异最小化 原则完成特征个数最小化的最优特征子集筛选;然后由模糊 优选模型得到有序综合指标特征数据集,其中在权重阶段提 出了距离差异度并以此为依据构建了一种组合主客观权重 的赋权方法,最后采用聚类分析将有序综合指标数据集聚类 为几个簇进而完成物联网差异数据的定位识别。仿真结果
1 2 削试q二 3

表明,提出方法的分类速度和精度对比传统方法有明显提 高,证实了研究方法的可行性。

图2不同数据集上本文方法与其它两种方法的错误率对比

从图2可以看出,在分类结果的比较上看,本文方法比 其它两种方法的分类错误率都低,结果较为准确。

参考文献:
[1] 封松林,叶甜春.物联N/传感网发展之路初探[J].IP时代与 物联网,2010,25(1):50—54. [2] 朱仲英.传感网与物联网的进展与趋势[J].微型电脑应用, 2010。26(1):l一3. [3]孔晓波.物联网概念和演进路径[J].电信工程技术与标准 化,2009,22(12):12一14. [4] 宁家俊.物联天下感知中国一一一物联网的技术与应用[J]. 信息化建设,2009,(5):13—15. [5]魏佳杰,郭晓金,李建寰.无线传感网发展综述[J].信息技 术,2009,(6):175—178. [6]徐光美,杨炳儒,秦弈青.一种新的多关系朴素贝叶斯分类器 [J].系统工程与电子,2008,30(4):655—657. [7] 图3本文方法与其它两种方法所用时间对比图 王慧,张翠羽.基于改进遗传算法的网络差异数据挖掘算法 [J].计算机仿真,2015,32(5):3ll一314. [8] 姜昱汐,迟国太,严丽俊.基于最大熵原理的线性组合赋权方 法[J].运筹与管理,2011,20(1):103—108.

从算法时间角度分析,因为本文算法是线性时间,所示 算法消耗最小;FO—CA算法在原始进程任何选则原始聚类 中心造成反复次数增多,算法时间消耗较大;贝叶斯方法在 聚类区分进程补充了特点选取的随机性,因此在时间上开销 较小。 综合错误率和耗时两项实验指标来看,本文方法在效率 和速度上较传统方法有明显优势,尤其是当物联网数据数目 增加时,优势更为突出。

[9]伍育红.浅议聚类分析方法[J].计算机科学.2012,39(6A):
325—329.

[10]赵妍.基于中间件的物联网多终端数据整合分析研究.[J]. 科技通报,2015,4(31):187—189.

[作者简介】 代恩华(1982一),女(汉族),山东冠县人,硕士,讲
师,主要研究方向:计算数学。

喻学涛(1980一),男(汉族),山东莘县人,硕士,讲
师,主要研究方向:控制工程与控制理论。

.--——323.--——

万方数据


相关文章:
三维可视化智能物联网管理平台设计
以实现智能化识别定位、跟踪监控和管理的 一种...而且实现了海量物联网 节点之间的协同工作, 从而大...场景模型库 三维数据虚拟仿真渲染 终端设备数据采集和...
面向物联网海量传感器采样数据管理的数据库集群系统框...
面向物联网海量传感器采样数据管理的数据库集群系统框架...$物联网数据的时空相关性 与普通互联网 结点不同!...5*@ ’)传感器件与设备)全球定位系 统等种种装置...
物联网课本知识点总结
物联网课本知识点总结_水产渔业_农林牧渔_专业资料...模糊识别等各种智能技术技术, 对海量数据和信息进行分析...网络仿真的研究主要集中在(体系结构) (系统建模) (...
物联网数据库系统
2 从数据的角度来看物联网大量来源不同、结构不同...是定位与调度、 实时监 控、测试与仿真的智能化中枢...支持对高速采集的海量数据进行长期的可靠存储,并 ...
基于物联网技术的警务大数据分析模型构想
一种利用大数据分析算法对海量警务物联网线索信息...工作关注对象进行自动感知识别,通过网络,技术处理和...警车警员 GPS 定位、城区视频监控、道路卡口车辆监控...
基于WIFI技术的物联网定位探讨
物联网将传感器和智能处理相结合,利用云计算、模 式识别等各种智能技术,扩充其应用领域。从传感器获得的海量信息中分析、加 工和处理出有意义的数据, 以适应不同...
物联网特点及应用
以实现智能化识别定位、跟踪、监控和管理 的一种...物联网部署了海量的多种类型传感器, 每个 传感器都...出有意义的数据, 以适应不同用户的不同需求,发现...
物联网概论
自动识别技术、嵌入式系统、定位技术、传感网络、中间件、物联网数据处理以及...物联网数据采集并传输然后应 用到服务层之后,解决数据计算速度的问题,海量的...
物联网重大专项课题指南
技术指标和数据格式 定义的标准,解决不同厂商超高频...标签码数字图像处理与识别、方向传感和空间定位技术。...支持物联网物物 通信海量信息的承载,提出基于已有...
物联网试题
39. 数据中心将成为解决海量数据存储的主要手段。 ...全球定位系统、 激光扫描器等等,赋予物体智能,并通过...(×) 21. 物联网与互联网不同,不需要考虑网络...
更多相关标签: