当前位置:首页 >> 信息与通信 >>

基于支持向量机的语音识别研究


基于支持向量机的语音识别研究

2009年

文覃绢号:1003-5850(2009)03—0012-03

基于支持向量机的语音识别研究
Research of Speech Recognition based 鄣月玲张雪英 (太原理工大学信息工程学院 【摘
白 on

Supp

ort Vector

Machine


太原030024)

要】为了得到较好的语音识别效果,构建了基于线性核函数支持向量机的非特定人孤立词语音识别系统,

取得了较高的识别率,并将该实验结果同基于HMM的识别结果进行了比较,显示出了支持向量机在基于有限 样本情况下进行语音识别的优势。 【关键词】支持向量机,线性核,语音识别
中图分类号:TN912
ABSTRACT system based In order
on

文献标识码:A
tO get

better results of speech recognition,we
support vector

construct



non—specific,isolated word speech recognition

linear kernel function

machine.Through doing
on



lot of

experiments,we get higher accuracy.By
support vector

comparing the results with that of speech recognition based
speech recognition when the training data is

HMM,we find that the

machine has advantage

on

small.

KEYWORDS

support vector

machine,linear kernel,speech recognition

语音识别是语音信号处理的重要研究方向,是模 式识别领域的重要组成部分。目前语音识别的方法主 要有隐马尔可夫模型方法和人工神经网络方法。隐马 尔可夫模型方法有很强的动态时间序列建模能力[1], 计算量小,但是它的理论基础是传统统计学,在用它进 行语音识别时有两个方面的局限性Ez]。一方面,需要知 道样本的参数化分布形式,过多地依赖了先验知识,另 一方面,传统统计学是样本数目趋于无穷大时的渐近 理论,而在实际问题中,样本数量往往是有限的。人工 神经网络是一种经验非线性方法,这种方法利用已知 样本建立非线性模型,有很强的模式分类能力,但是它 缺乏坚实的数学理论,需要借助于经验,得到的模型通 常是局部最优,而非全局最优,而且还具有网络结构难 以确定,容易过学习或泛化能力差等难以弥补的缺陷。 支持向量机(Support
Vector

1支持向量机
1.1线性支持向量机 设存在样本(zl,y1),(z2,Y2),…,(zf,∞),其中zf
∈Rd

Y,∈{+l,一1),i一1,…,l,yi标明它所对应的向

量z。属于两类中的哪一类。Z为样本个数,d为输入维 数。 若存在分类面训·.27+b=0使得 Yr(硼·.Ti+6)≥1,V iE{1,2,…,Z} 则称训练集是线性可分的‘3‘。 分类面硼·x+b=O的分类间隔为
d(硼,6):min W—1*—xTi-qt一-b—max w—_T"—xri-3t一-b: l硼l l硼I 饥lyi=1} {xih=一1) (1)

Machine,SVM)是

丽一丽一丽 击一嵩一南



屺’

Vapnik等1995年提出的一种新型机器学习方法,它 是专门针对有限样本情况的,追求在现有有限信息的 条件下得到最优结果。它是建立在统计学习理论的结 构风险最小化原理和VC维理论基础上的,根据有限 的样本信息在模型的复杂性(即对训练样本的学习精 度)和学习能力(即无错误地识别任意样本的能力)之 间寻求最佳折衷,以期获得最好的推广能力u]。支持向 量机在很大程度上解决了模型选择与过学习问题、非 线性和维数灾难以及局部极小点等问题。

满足不等式(1)且使分类间隔最大的分类面就是 最优分类面,显然,最大化分类间隔d(w,6)可以转化 为在约束条件(1)下最小化I硼l 2/2。采用拉格朗日乘 数法求解,问题等价于:

minw(口)一百1∑∑啦qy,协∥乃一∑嘶
S。T.:
·

(3)
(4)

啦≥0



2.3 a/yr—O 其中i一1,2,…,z。

(5)



2008—10-25收到。2009—02—03改回

*鲁

基金项目:山西省自然科学基金资助项目(2008011031);山西省科技攻关计划基金资助项目(2007031132);山西省高校科技 研究开发项目(2007113);太原市大学生创新创业专项项目(08122037)。

***郭月玲.女.1982年生,硕士研究生,研究方向:语音信号处理。

万方数据

第2z卷第3期

电脑开发与应用

Gti是上述二次规划优化问题所求解的拉格朗日乘 子,每一个拉格朗日乘子嘶对应一个训练样本Xi。啦>

③径向基核函数(Radial

Basis Function Kernels)

K(x,y)==已一7IJ—y12

0所对应的训练样本就被称为“支持向量帕3。设口’为
上述二次规划所得解,得到分类函数为:


(至)Sigmoid核函数(Sigmoid

Kernels)

K(x,y)=tanh(hx·y+f)

f(x)=sgn(w‘·x+b。)=sgn(∑ai"y。(xi·z)+6。](6)
f暑1
.一.

2仿真实验及其结果讨论
2.1语音识别系统 不同的语音识别系统所采用的基本技术是相似 的。一个典型的语音识别系统主要包括预处理、特征提 取和训练识别网络等几个部分。对语音信号的预处理 主要包括反混叠失真滤波、预加重以及端点检测等内 容。经过预处理后,对语音信号进行特征提取。将这些 特征数据保存成特定的特征文件作为SVM的输入来 进行训练和识别。 2.2试验及其结果分析 实验采用的语音样本为孤立词,语音信号采样率 为11.025kHz,帧长N一256点,帧移M一128点。词 汇量分别为10词、20词、30词、40词和50词。训练样

其中锄’一乙a;yizi,b。=yi一22Yi征?(zi·xj),
V jE{JI酊>O}。





如果训练样本线性不可分,那么在线性可分情况 下的优化问题将变得无解。为此引入松弛变量£>io, i一1,…,Z,得 Yt(硼·Xi+6)≥1一£,V f∈{1,2,…,Z)
(7)

最大化分类间隔d(w,6)转化为在约束条件(7)和 毫≥o下最小化I硼1 2/2+C[∑e/]。其中C>O是控制 惩罚程度的常数,C越大表示对错误分类的惩罚越大。 采用拉格朗日乘数法求解,问题等价于:

minⅣ(口)一百1∑∑嘶qyfy西.q一∑嘶


(8) (9)

本为9人在15dB、20dB、25dB、30dB、无噪音下的发 音,每个人每个词发音3次。预测数据为另外7人在相 应SNR下的发音。语音特征为MFCC特征。 将准备好的数据送到开放源码的支持向量机工具 libsvmc5]中去训练和识别。采用线性核函数。由于支持 向量机实现的是两分类,在进行多类分类时,采用“一 对一”策略,即对Ⅳ类样本两两组合,构造C知=Ⅳ(Ⅳ 一1)/z个支持向量机,以投票的方式决定样本的类 别。将实验结果与使用相同特征在基于HMM语音识 别系统平台上的实验结果[63进行比较。表1为识别结 果的比较。
表l识别结果比较(%)

厶I工1

J;I

i=l

S.T.:

O≤嘶≤C

∑aiyi—C
其中i一1,...,z。 1.2非线性支持向量机

(10)

对于非线性分类问题,引入核函数K(x,y),将原 输入空间中的非线性划分问题转化为高维特征空间中 的线性划分问题。 优化问题等价于:

minⅣ(口)一百1∑∑嘶哪了Ⅸ(%zj)一∑哦


厶‘;I

J=I

i=1

(11)

词汇量 (词)
10

\SNR
SVM HMM

方心
SVM

15dB

20dB

25dB

30dB

clean

95.71 86.67 96.43 83.80

96.19 91.90 96.90 88.57

96.67

96.67

99.05

S.T.:

25aiyt—o O≤啦≤C

(12) (13)

92.86 97.38 90.47

93.33 96.90 91.47 96.83

95.24 98.10 93.57 98.10

其中i—l,…,z。 决策函数为:

20

·HMM SVM
30

96.19 83.33 96.07 82.76

96.67 87.73 96.19 87.57

97.30 90.32 96.67 90.00

f(x)=sgn[∑a?yiK(xi,z)+6。]
其中b。YJ--Myi&K(xl,xj),V
0}。

(14)

HMM SVM
40

90.48 96.19 90.33

93.74 97.74 92.33 97.33

jE{j la/>
50

HMM SVM HMM

95.43 81.19

96.00 86.66

96.38 89.90

96.19 92.28

1.3几种常用的核函数 ①线性核函数(Linear
Kernels)

92.85

从表1可以看出,基于支持向量机模型的语音识 别实验取得了较HMM模型高的识别率,充分证明了 支持向量机在有限样本情况下进行识别的优势,同时
(下转第17页)

K(x,y)一z·Y

②多项式核函数(Polynomial

Kernels)

K(x,y)一(kx·Y+c)4

万方数据

第22卷第3期

电脑开发与应用

Y—aA+8B一7C

名在本赛区前3(含)),而另一只是排名较弱的对手。 这种所占的比例为90%。也不排除都是强队或都是弱 队,这种比例只占10%。
·

其中A为体力恢复矩阵、B为周末主场优势矩 阵、c为飞行旅途劳累矩阵。根据三因素在比赛中的重 要性,给,口、p、),赋初值:口一0.75、//=0.20、y一0.05。 应用软件计算的各队综合利弊指标排名见表7。 3.3问题二的求解 统计各个同部不同区赛3场(2主1客或2客1 主)情况。
表8东南区、中部区赛3场(2主l客或2客1主)情况表
东南区 2主

这种方法是一种比较科学的方法,已经全面考虑 比赛区域覆盖的均衡,综合对手实力的均衡。唯一美中 不足的是,有较低比例同时是两个强队或弱队与之比 赛。

4结束语
本文从多个因素并考虑各个因素在比赛中的影响 程度结合matlab软件分析NBA2008年~2009年常 规赛对30支参赛队的利弊情况进行分析。
参考文献

2客 76人23

中部区

2主 猛龙22

2客

骑士32 魔术1l 蓝网24 步行者33 奇才12 猛龙22 活塞3l 老鹰13 76人23 凯尔特人21 山猫14 公牛34 尼克斯25
热火15

魔术ll 76人23 山猫14

活塞31 活塞31 凯尔特人2l 骑士32 雄鹿35 尼克斯25 公牛34 骑士32 公牛34 篮网24 奇才22 雄鹿35 雄鹿35 老鹰23 热火15 奇才12 山猫14 76人23 尼克斯25
凯尔特人21

老鹰13 魔术1l 篮网Z4 尼克斯25 奇才12 凯尔特人21

[1]
猛龙22 篮网24 热火15
老鹰13

王沫然编著.MATI。AB6.0与科学计算EM].北京:电
子工业出版社。2001.

步行 者33

Ez] [3]

刘庆山.体能训练基本理论与我国高水平篮球运动员 体能训练研究EDJ.北京:北京体育大学,2004. 王瑞元.运动生理学EM].北京:人民体育出版社,
2002.

(上接第13页)

体现了支持向量机追求在现有有限信息的条件下得到 最优结果的优点。 虽然支持向量机有很多其他识别网络不具有的优 点,但它还有一些方面存在问题需要解决。比如,核函 数中核参数的选取缺乏理论的指导,通常都是通过反 复的实验,人工选取出较为满意的解。这些缺点影响了 支持向量机的应用领域和效果,拓宽它的应用领域和 改善它的应用效果还有待于这一模型自身的发展和完 善。
参考文献 I=l ]

表9西南区赛3场(2主1客或2客l主)情况表 西南区
2主

2客 太阳62

太平洋区

2主

2客 小牛44 爵士51 掘金52 火箭43 灰熊45 开拓者53 掘金42 雷霆55 森林狼54 黄蜂41

快船65 黄蜂41 爵士51 掘金52 马刺42 国王64 雷霆55 火箭43
太阳62

马刺42 湖人61 雷霆55 黄蜂4l 太阳62 森林狼54 掘金52
勇士63

森林狼54 湖人61 爵士51 开拓者53
国王64

小牛44 开拓者53
国王64

朱志字,张冰。刘维亭.基于模糊支持向量机的语音 识别方法[J].计算机工程,2006,32(2):180—182. 谢湘,匡镜明.支持向量机在语音识别中的应用研 究Ec3.2003年通信理论与信号处理年会论文集.北 京:电子工业出版社,2003.

湖人6l
小牛44

雷霆55 勇士63 掘金52 快船65 快船65

瞳]

开拓者53
勇士63

火箭43 爵士51 灰熊45

灰熊45 森林狼54

口]
I!J ]

范昕炜.支持向量机算法的研究及其应用[D].杭州:
浙江大学,2003.

从表8~表9中可以发现,以下规律: 规律一:每个队都会出现一次2主1客与2客l 主,有且只有一次; 规律二:如果是2主l客的比赛,则会是在同部分 别在两个不同区;2客1主的情况与2主1客的情况 一样; 规律三:每只球队如果赛3场(2主1客或2客1 主)中2主场或者2客场,对手则会是一只是较强(排

苏毅,吴文虎.郑方等.基于支持向量机的语音识 别研究EC].第六届全国人机语音通讯学术会议论文 集.北京:中国中文信息学会,2001.

口]

Chih—Chung Chang and

Chih—Jen Lin.LIBSVM:A Machines.2001.Software

Library for Support Vector available
at

http://WW_、N.csie.ntu.edu.tw/~eilin/

libsvm,2008—06—07.

印]

梁五洲.抗噪语音识别特征提取算法的研究[D].太 原:太原理工大学,2006.

万方数据

基于支持向量机的语音识别研究
作者: 作者单位: 刊名: 英文刊名: 年,卷(期): 被引用次数: 郭月玲, 张雪英, 白静 太原理工大学信息工程学院,太原,030024 电脑开发与应用 COMPUTER DEVELOPMENT & APPLICATIONS 2009,22(3) 0次

参考文献(6条) 1.朱志宇.张冰.刘维亭 基于模糊支持向量机的语音识别方法[期刊论文]-计算机工程 2006(02) 2.谢湘.匡镜明 支持向量机在语音识别中的应用研究[会议论文] 2003 3.范昕炜 支持向量机算法的研究及其应用[学位论文] 2003 4.苏毅.吴文虎.郑方 基于支持向量机的语音识别研究[会议论文] 2001 5.Chih-Chung Chang.Chih-Jen Lin LIBSVM:A Library for Support Vector Machines 2008 6.梁五洲 抗噪语音识别特征提取算法的研究 2006

相似文献(10条) 1.学位论文 王惠贤 支持向量机在图像检测和识别中的应用 2007
支持向量机(Support Vector Machine,简称SVM)是一种建立在统计学习理论基础之上的机器学习方法,是模式识别领域的新方法.和神经网络算法 类似,它主要也是用于解决分类问题和回归问题的,已经在很多领域有了广泛的应用,如;图像检测,人脸识别,经济预警等.本文就支持向量机算法在 图像检测及识别中的应用进行深入的研究. 本文的主要研究工作如下: 1.针对支持向量机中的决策函数的复杂度问题,提出了一种利用线性核来解决线性不可分问题的算法.试验表明,利用我们的算法来解决人脸检测问 题时,不但能够达到非线性核(例如:rbf核)的分类精度,而且运算速度比用非线性核快得多,基本上达到了实时检测图像的目的. 2.核函数中的参数选择是支持向量机中的一个很重要的问题,它直接影响模型的推广能力.K-L交叉验证是核参数选择的一种普遍方法,到目前为止 ,也是最实用的,但速度却很慢.为了提高该方法的速度,本文提出了一种由粗选到细选的筛选方法,试验证明了我们算法的实用性. 3.普通的C-支持向量机是以解决一个二次规划问题来实现算法的,训练速度很慢,在大多数图像处理的文献中,多采用这种方法.本文尝试采用线性 规划的支持向量机来解决图像的识别问题,在提高训练速度的同时,取得了很好的效果. 4.在图像检测过程中,巧妙的运用了支持向量机能够特征选择的特性,大大降低了图像的维数,使检测速度更加快速. 5.给出了运用支持向量机进行图像检测与识别的详细步骤,并用MFC进行了C++编程,建立了相关的系统.该系统不管是对验证我们方法的正确性,还 是实用性方面,都是大有补益的.

2.期刊论文 郭建林.戴国强.GUO Jian-lin.DAI Guo-qiang 表情识别中支持向量机核函数选取研究 -电脑知识与技 术2009,5(20)
支持向量机表情识别的准确率和时间消耗取决于核函数选取和特征数目.该文讨论了支持向量机的表情分类和核函数的实验方法,并进一步探讨了核 和特征数目与识别准确率和时阍消耗的关系.基于JAFFE数据库和LibSVM2.86的实验表明,随着特征数目的增加,训练时间呈指数增长,交叉验证准确率先增 加后降低,表现为某种单峰分布.同时表明,线性核时间消耗最小,径向基核在特征数目较小时,具有最好的识别率,而在特征数目较大时,线性核最优.综合 时阍和识别率考虑,在低维时,优先选用径向基核,高维优先选用线性核.

3.学位论文 雷瑾 基于支持向量机的船舶主机缸盖故障诊断的研究 2007
机械故障诊断的发展历程中,故障确诊率的提高一直是研究的热点。为了系统地阐述机械故障诊断中的问题,本文中给予了相关的定义及分类。按 照机械故障诊断推理过程的环节,详细分析了故障产生的机理和具体的原因。 采用小波分析法和时间序列分析法由柴油机缸盖表面振动信号来识别气缸压力,通过对示功图进行分析计算得到了相应的放热规律。本文将柴油机 工作循环的模拟计算与前述放热规律的多工况计算相结合,根据柴油机缸盖振动信号来预测其多工况性能。 故障诊断本质上是一种模式识别或分类的方法。在理论上和应用上,支持向量机(SVM)都是非常有价值的模式识别方法。由于支持向量机的分解原理 是局部最优值恰是全局最优值的一个二次规划,在训练和识别中可以避免陷入局部最优值的泥沼。它基于结构风险最小化原则,可以在算法复杂性(VC维 )和训练准确性(结构风险最小化)之间进行最优化平衡,因而有良好的泛化能力。 支持向量机(SVM)是一种基于统计学习理论和结构风险最小化原则的新型机器学习方法,克服了传统机器学习方法在训练中的局部极小问题,过学习 和欠学习等问题,具有很好的泛化能力。本文介绍了支持向量机(SVM)在船用柴油机缸盖故障诊断应用的基本理论,然后以随机激励下压电智能结构的响 应数据作为训练样本集,仿真结果验证了这种方法的有效性。 本文在学习探讨SVM算法的同时,结合SVM在船用柴油机缸盖故障诊断中的应用研究进行了论述。 第一章主要介绍SVM基础理论和原理。支持向量机(简称SVM)已经成为样本学习的最普遍的方法之一,并且在科学和工程技术上有许多潜在的应用。 支持向量机是一种新型的基于破坏性风险最小化理论基础上的机器学习手段,即使在样本很少时也显示出很好的泛化能力。在有限样本的机器学习中显 示出优异的性能。作为结构风险最小化归纳准则的具体实现,支持向量机具有全局最优性和较好的泛化能力。支持向量机已经发展成为在噪声、复杂控 制领域进行分类,有效回归的有力工具。支持向量机的两个主要特征是泛化理论和核函数,泛化理论提供了选择假设的原理和方法,而核函数则能够在 不明确要求非线性算法的情况下在假设空间中引入非线性。 目前SVM是模式识别领域中最先进的机器学习算法,它已初步体现出很多优于已有方法的性能。由于采用了结构风险最小化原则代替经验最小化原则 ,支持向量机能够较好地解决小样本学习的问题。又由于采用了核函数的思想,使它能够把非线性空间的问题转换到线性空间,降低了算法的复杂性。 第二章介绍了船用柴油机通过噪声和振动信号对故障进行检测。因为柴油机工作循环的周期性和多变性,柴油机的振动和噪声是很复杂的。因此 ,通过这些信号来检测机械故障是困难的。 研究表明,许多情况下检测超过20000HZ或更高一点的系统,检测本征频率是有效的检测方法。同时也表明,对于振动信号的检测优于对声音信号的 检测。 这两种相对高频的信号,正常运转时不明显,而在故障时会增大到一个很高的程度,远高于低频信号和较低的系统固有频率的增加幅度。因此,根

据高频信号去检测故障会更容易些。柴油机机械部件需要新的或改进的监控方法。本章主要讨论了一些应用噪声和振动信号对柴油机进行故障检测的方 法。 第三章阐述了船用柴油机主机缸盖的故障诊断研究。在产品制造和使用过程中对质量要求的提高激发了制造商和用户对故障检测和诊断方面研究的 发展。大多数生产制造和使用过程涉及许多相关变量。当其中有一个变量偏离它的既定范围时,故障就会发生。迅速而有效的诊断系统有助于避免出现 质量问题和进行预防性维护修理。 故障诊断系统有两个任务,故障检测和故障诊断。前者的目的是为了确定系统中发生的故障。将系统所有有用的信息收集处理并判别与正常工作时 的不同。例如,温度,压力,波动率,流量,噪声等信息。后者被用于确定故障种类和故障源。回转机械中,故障主要原因在于轴承出现问题。掌握和 诊断轴瓦存在的故障是增加运行可靠性的一种途径。 活塞式内燃机中参与燃烧过程的机械部件故障可以从气缸示功图,排气阀,声音和振动信号反映出来。 第四章是本文的一个主要研究内容,主要侧重于应用SVM对船用柴油机缸盖振动信号特性及典型故障的诊断。船用主柴油机的振动信号包含了关于燃 烧室部件寿命的有用信息。它常用来控制检测机器前期故障。几种常发生的故障可以从四冲程柴油机文献记录的振动信号得出。柴油机部件工作状态可 以通过监测气缸盖振动信号得出。 通过讨论由气阀冲击和燃烧压力引起的气缸盖振动信号的特征,提出一些适用于柴油机振动控制和故障诊断的准则。通过支持向量机方法,建立信 号模型和等价冗余模型,通过测量和分析检测出导致产生冗余误差的故障。 研究结果表明,SVM成功地被应用于许多研究方向,例如模式识别,多元回归非线性模型匹配等。结果表明,不但从理论角度看该技术令人满意,而 且在实际应用中有很高的绩效。 第五章是结论与展望。对本文作了简要的总结,并对SVM的应用作了展望。新的对机器的检测途径,是以支持向量机的神经网络方法为基础的,现在 已经开始应用。检测可以理解为对部件缺陷的识别,部件缺陷意味着数值高于或低于设定范围。这种方法的特征是高精度和高速度。当神经网络被建立 后,不管环路的大小,都能迅速的识别故障。因而这种方法适用于实时的缺陷定位。支持向量机神经网络的优势在于它的良好的泛化性。仅仅基于有限 数量的各种故障的典型缺陷样本,就可以在大范围内识别有关部件参数和承受力的非理想缺陷。在机器样本的故障检测中,支持向量机的方法比当前应 用方法的精确性要高。 实验结果表明支持向量机方法比传统的人工神经网络方法和其他方法更有效。在研究中,它对多类故障的分类有很多优势:算法简单;分类容易和 效率高。它非常适宜联机监控和诊断。SVM提供了一种新的有益的途径,用于发展智能诊断。 这种方法能改善故障诊断的稳健性和准确性,而且它还可以应用到其他的领域。基于目前的研究,可以得出以下的结论: 1)SVM是一种非常好的故障诊断的方法,它具有许多有利的特性。首先,它有能力处理非可见样本并且准确。其次,它仅仅要求很少量的样本。再者 ,在决策过程中,它只需要很少的的计算量。所有的这些特性使它成为了一种非常有吸引力的故障检测方法。 2)SVM的成功之处主要在于它应用核函数将信号映射到更高维的特征空间,在特征空间中可以检测到信号的附加特征值。有趣的是,只要样本足够大 ,核函数的选择并不是决定性的因素。 今后的研究应集中在选择更适宜的传感器装置使检测最优化。打算进行基于特征提取的故障检测和诊断(FDD),这样可以减少计算的复杂性,也有利 于(FDD)使用实时数据。还计划建立一些完善的模型,这会有助于将来船舶柴油机的故障检测和诊断。 总之,因为SVM完备的理论基础和出色的学习性能,其已经成为了机器学习界的研究热点,并在很多领域都得到了成功的应用。但是作为一种新兴技 术,SVM在很多应用领域的研究都还有待于探索和完善。如核函数和参数的选择缺乏理论指导、训练算法的不完善、不支持增量学习等。这些问题的存在 ,使得SVM在很多领域的应用受到了较大的限制。实验显示,在短期预测中4种核函数有着基本相同的预测能力,而在长期预测中,向基函数核和多项式 核表现出了相对较高的预测能力,同线性核和神经网络核相比,它们的归一化均方误差约降低了20%。SVM与向后传播神经网络、径向基函数网络和广义 回归神经网络预测能力的对比表明,实现了结构风险最小化原理的SVM具有更好的预测能力,在长期预测中,其归一化均方误差约降低了15%。 本文在学习探讨SVM算法的同时,对SVM在船用柴油机缸盖系统故障诊断中的应用进行了论述,运用支持向量机理论对其进行了故障诊断的仿真研究 和实验研究,其中包括实验系统数学模型的设计、仿真系统的建立(用Simulink仿真软件建立仿真模型)、特征参数的提取、数据的采集等。

4.期刊论文 闫志刚.白海波.张海荣.YAN Zhi-gang.BAI Hai-bo.ZHANG Hai-rong 一种新型的矿井突水分析与预测 的支持向量机模型 -中国安全科学学报2008,18(7)
针对矿井突水样本数少,信息不完整的特点,提出了矿井突水分析的线性核H-SVMs模型.推导模型的理论推广误差公式,设计自顶向下基于SVM最大间隔 逐层分类构造H-SVMs的新方法,并应用于实际的矿井突水预测.实验结果表明,线性核H-SVMs模型结构简单、泛化能力强,不仅能很好地预测矿井突水,而且 其层次结构能正确反映突水的等级关系,各判别函数的法向量还可以指示各突水影响因素的权重,通过判决函数能有效分析突水影响因素并提取突水预测 规则,为矿井突水预测提供了新的方法.

5.学位论文 幸运 基于支持向量机的汉语词义消歧研究 2006
词义消歧一直是计算语言学领域的一个重要研究课题,其对机器翻译、信息检索、内容和主题分析、文本分类、语音识别等领域有着重要的影响。 本文以北京大学计算语言学研究所开发的较大规模的《人民日报》词义标注语料为基础,从以下几个方面进行了研究: 提出一种递减的特征选择算法考察各种上下文知识的组合对有指导词义消歧的影响。实验表明,丰富的上下文知识有利于词义消歧。采用支持向量 机方法进行词义消歧,剖析了支持向量机方法的两个重要方面:核函数的选择和多类别支持向量机方法。通过实验表明,相对于其他核函数而言,线性 核函数具有训练速度较快,正确率较高的特点。在目前的多类别SVM方法中,一次优化决策的方法训练速度快,易于构造,且消歧效果较好。 通过上述研究,本文采用线性核、一次优化决策的多类别支持向量机方法对3个月的《人民日报》语料进行词义消歧,达到了83.82﹪的正确率。实 验也表明使用支持向量机的方法进行词义消歧的效果比最大熵方法好,但是支持向量机方法也有训练速度较慢的缺点。 本文还对SENSEVAL-3的中文评测语料进行词义消歧评测,支持向量机方法达到了64.91﹪的正确率,比最大熵方法提高了2.38个百分点。表明支持向 量机方法在小样本情况下具有较明显的优势。

6.期刊论文 何熠.吴爱国.信赢.He Yi.Wu Ai-guo.Xin Ying 基于支持向量机的超导限流器故障电流模式识别研究 -哈尔滨工程大学学报2006,27(z1)
对于饱和铁芯型超导限流器,指出短路故障电流需要快速识别,设计和制造了三相小样机和相应的基于labview和NI板卡的实时检测控制系统.提取了 短路故障电流的2个重要特征:电流实时幅值,电流变化率,.根据特征,分别采用神经网络感知机模式分类,线性核的支持向量机和径向基函数核的支持向量 机,离线在matlab环境下训练,找出最优分类面.对几种方法进行比较实验,实验数据验证表明了RBF核支持向量机具有最好的识别效果.但是该方法难以在 FPGA中实现,而线性核支持向量机是综合识别效果和可实现性2个指标的最佳选择.

7.学位论文 周喜斌 基于支持向量机的蛋白质结构和功能预测研究 2008
随着人类基因组计划(HGP)的顺利完成和现代生物科学和技术的迅猛发展,每天都有大量的蛋白质序列数据不断涌现。对这些数据进行深入研究以达 到对化学和生物意义的深入理解,是现代生物信息学的热点。尽管蛋白质的结构和功能可以通过实验方法确定,但是实验方法十分耗时并且费用昂贵。 因此,从蛋白质序列出发,发展自动的、可靠的理论预测方法具有十分重要的理论意义和实用价值。本文基于近年来不断涌现的蛋白质序列数据,采用 新兴的机器学习方法——支持向量机,并结合小波变换以及信息融合等技术,对蛋白质的结构和功能预测进行研究,其主要内容如下: 1.建立了酶亚家族类预测新方法。将Chou等人提出的两性伪氨基酸组成与支持向量机结合,采用一对多的分类策略,建立了酶亚家族类预测模型。 对Chou等人建立的氧化还原蛋白酶的标准数据集进行了jackknife检验,总预测精度达到了80.87%,分别比Huang等人和Chou提出的方法提高了4%和 10%。在此基础上,基于氨基酸残基的疏水值,提出了一种新颖的伪氨基酸组成,用于表征蛋白质序列。与两性伪氨基酸组成比较,本文提出的伪氨基 酸组成表征方法具有计算简便、运算快速的优点。 2.建立了凋亡蛋白亚细胞位点预测新方法。基于信息融合技术,提出了双层支持向量机方法,用于凋亡蛋白亚细胞位点定位研究。在第一层中,分 别对多个蛋白质的性质,即氨基酸组成、双残基组成和两性伪氨基酸组成建立三个子分类器,然后将这三个子分类器的预测结果经过合并,输入到第二 层支持向量机中,由其给出最终的预测结果。对Zhou和Doctor建立的标准数据集ZD98,以及Zhang等人的数据集ZW225进行了jackknife检验,总预测精度 分别为94.90%和88.44%,优于现有文献报道值。结果表明:双层支持向量机方法能够较好地利用信息之间的互补,从而取得比基于单一蛋白质性质的

分类器更高的预测精度。 3.提出了新的蛋白质序列表征方法。将加权思想引入Kurgan等人的组成位置向量概念,提出了加权组成位置向量的蛋白质序列 表征方法。与传统的氨基酸组成表征方法相比,加权组成位置向量不但包含了蛋白质序列中氨基酸残基的组成信息,还含有氨基酸残基的位置信息。我 们将加权组成位置向量与支持向量机结合,采用直接的多类分类策略,对蛋白质结构类预测进行了研究。通过对两个非同源的蛋白质结构类标准数据集 Z277 and Z498的jackknife检验,预测精度优于文献报道的多数方法。结果表明:在组成位置向量表征方法中引入加权因子十分必要,通过调节加权因 子可以明显地提高预测精度。 4.构建了新的伪氨基酸组成表征方法。首先用氨基酸残基疏水值将蛋白质序列映射为数值序列,然后进行小波包分解,计算小波包功率谱,最后将 小波包功率谱与氨基酸组成相结合,构成伪氨基酸组成表征蛋白质序列。将其与支持向量机结合,采用直接的多类分类策略,对蛋白质结构类预测进行 了研究。对Zhou建立的结构类标准数据集Z277进行了预测,jackknife检验总预测精度达到了84.8%。结果表明:基于小波包变换建立的伪氨基酸组成表 征方法能够有效地反映蛋白质序列中氨基酸残基之间的顺序信息,从而提高预测精度。 5.建立了蛋白质亚核位点预测方法。通过对支持向量机中基本的核函数进行线性组合,得到组合核函数。将其与蛋白质的氨基酸组成性质结合,提 出了蛋白质的亚核位点预测方法。对蛋白质亚核位点数据集SN370进行了预测,5-折交叉验证和jackknife检验总预测精度分别为66.03%和67.93%。在 此基础上,与线性核、多项式核、径向基核支持向量机方法进行了比较。结果表明,对于蛋白质亚核位点定位问题,基于组合核函数的支持向量机方法 能够取得比单一核函数更好的预测效果。

8.会议论文 何熠.吴爱国.信赢 基于支持向量机的超导限流器故障电流模式识别研究 2006
对于饱和铁芯型超导限流器,指出短路故障电流需要快速识别,设计和制造了三相小样机和相应的基于labview和NI板卡的实时检测控制系统.提取了 短路故障电流的2个重要特征:电流实时幅值,电流变化率,.根据特征,分别采用神经网络感知机模式分类,线性核的支持向量机和径向基函数核的支持向量 机,离线在matlab环境下训练,找出最优分类面.对几种方法进行比较实验,实验数据验证表明了RBF核支持向量机具有最好的识别效果.但是该方法难以在 FPGA中实现,而线性核支持向量机是综合识别效果和可实现性2个指标的最佳选择。

9.学位论文 汪晓玲 基于SVM的银行客户个人信用评估研究 2007
随着中国加入WTO以后,银行业的服务将是其盈利的最主要手段。而这些原有的和不断增加的服务并不适应于其所有的客户群体,所以要对客户的信 息进行分析,对其进行有效的分类,找出某种服务所适应的群体。这样可以为银行有效地节省大量的成本,从而提高其盈利能力,使得我国银行业能够 在激烈的国际竞争环境下,处于不败之地。随着近几年来经济的快速发展,国内的银行业务也随之迅猛发展,在其为银行带来大量客户源和丰厚利润的 同时,却也使得信用评估的工作量剧增,以往仅靠个人经验的信用评估模式已经力不从心了,因此对于客户信用评估的智能化研究就越来越显示出其举 足轻重的重要意义。 数据挖掘是一种融合了数据库、人工智能和数理统计等多学科特点的新技术。它是从大量、复杂的数据中迅速获取新颖、有效知识的过程。分类是 一种最常见的数据挖掘任务,它通过经验数据训练得到的分类器来预测未知数据的类别。 支持向量机是数据挖掘中的一种新方法,以其优秀的理论基础即结构风险最小化理论、条件二次优化理论和核空间而倍受关注。其核心思想是将一 个复杂的分类任务通过核函数映射使之转化成一个在高维特征空间中构造线性分类超平面的问题。它具有全局最优、结构简单、推广性好等优点。近年 来已经在手写数字识别、人脸识别与人脸检测以及文本分类等模式识别领域有了很好的应用。 本文首先介绍了课题的应用背景、信用评估的现状和现存的个人信用评估方法,提出了一种改进的银行客户信用评估方法。然后介绍了数据挖掘中 常用的分类方法,通过比较各种分类方法的优点和缺点,最终选用支持向量机。 其次,深入研究了支持向量机的理论和算法。重点研究了Platt提出的序列最小最优化算法(SMO),实现了Keerthi提出的改进的序列最小最优化算法 ,并且实现了线性核、多项式核、径向基核和Sigmoid核四种核函数。 再次,设计和实现了基于支持向量机的银行客户信用风险评估原型系统,并把该系统应用于国外某商业银行客户信用风险评估。该原型系统实现了 数据预处理模块和SVM分类模块(两分类SVM算法和一对一的多分类SVM算法)。通过所构建模型的预测准确率对比,证明了改进后的客户信用评估方法优于 原有的打分方法。 最后对全文的工作进行了总结和展望。

10.期刊论文 吴建宁.王珏.Wu Jianning.Wang Jue 采用支持向量机评估老年人步态对称性的研究 -西安交通大学 学报2007,41(8)
采用支持向量机(SVM)评估老年人步态的对称性.将鉴别老年人下肢左、右两侧的步态模式相似性问题转化为二分类问题,通过识别老年人下肢左、右 两侧的步态模式,确定其两侧步态模式相似性的差异,判断其步态的对称性.采集24名健康老年人下肢左、右两侧的步态数据,采用交叉验证方法评估SVM泛 化能力,测试了多项式核、径向基核、线性核.结果表明,多项式核、径向基核的泛化能力优于线性核,基于多项式核的SVM识别左、右两侧老年人步态模式 的分类正确率较高(88%),可有效地提取步态模式的非线性信息.SVM有望成为评估老年人步态对称性的一个有效的工具,有助于及早预防老年人跌倒和老年 性疾病发生,提高老年人生活质量.

本文链接:http://d.g.wanfangdata.com.cn/Periodical_dnkfyyy200903005.aspx 授权使用:太原理工大学(tylgIP),授权号:c2f6d166-f074-49b5-9e71-9dbf00b8717d 下载时间:2010年7月26日


相关文章:
支持向量机语音识别算法在OMAP5912上的移植
支持向量机语音识别算法在 OMAP5912 上的移植作者: | 出处:维库开发网 | 2010-08-20 10:31:02 | 阅读 识别技术应用于嵌入式产品中已得到广泛应用。SVM( 277...
语音识别文献综述
当今,基于 HMM 和 ANN 相结合的方法得到了广泛的重视。而一些模式识 别、机器学习方面的新技术也被应用到语音识别过程中,如支持向量机(support vector machine,...
语音识别技术的研究与发展
语音识别技术的研究与发展王敏妲 时间:2010 年 02 月 26 日 关键词:语音识别...模型的隐马尔可夫模型(HMM)的方法、基于人工神经网络(ANN)和支持向量机等语音...
语音识别论文(长文档排版)
本论文旨在探讨支持向量机(SVM)理论在语音识别上的应 用,研究基于支持向量机(SVM)语音识别的关键问题,并将其拓展到实际应用领域。 选题意义包括以下几点: 探讨语音...
基于支持向量机的说话人识别系统径向基核函数算法研究及参数优化--开题报告
基于支持向量机的说话人识别系统径向基核函数算法研究及参数优化--开题报告_兵器...基于支持向量机的的说话人识别系统的设计重点是根据语音识别系统的原理确定功能, ...
于支持向量机的电话语音
电话逐渐成为人们日常交流和感情沟通的重要手段, 电话语音的识别研究也就相 应变得...本文提出了一种基于支持向量机的电话语音/铃声分割方法,并 重点介绍了一种对...
语音识别系统关键技术的探究
模型(HMM)、人工神经元网络(ANN)、支持向量机(SVM...本文主要研究语音识别的关键技术,并分析它们的特点、...基于语音识别技术的门禁... 5页 免费 语音识别技术...
国内统计信号处理在语音识别的应用
摘要语音识别是以语音为研究对象, 通过语音信号处理...(VQ)、人工神经网络(ANN)、支持向量机(SVM)等方法...提出了一基于 2 阶和 4 阶积累序列匹配的辨识非...
基于支持向量机的图像分类研究
基于支持向量机的图像分类研究_工学_高等教育_教育专区 暂无评价|0人阅读|0次下载基于支持向量机的图像分类研究_工学_高等教育_教育专区。目录 摘要... 2 Abstra...
更多相关标签:
研究生语音识别就业 | 语音识别研究现状 | 语音识别技术研究 | 语音情感识别研究现状 | 语音识别研究员 | 研究生语音识别 | 支持向量机人脸识别 | 支持向量机 图像识别 |