基于连续隐马尔科夫模型的语音识别
无需注册登录,支付后按照提示操作即可获取该资料.
摘要
语音识别系统中最重要的部分就是声学模型的建立,隐马尔可夫模型作为语音信号的一种统计模型,由于它能够很好地描述语音信号的非平稳性和时变性,因此在语音识别领域有着广泛的应用。
隐马尔可夫过程是一个双重随机过程:一重随机过程用于描述非平稳信号中短时平稳段的统计特征;另一重随机过程描述了每个短时平稳段如何转变到下一个短时平稳段,即短时统计特征的动态特性。
为了能够对HMM有一个全面的认识并能够将其应用于解决实际问题当中,本文介绍了HMM的基本理论以及其如何将其应用于语音识别中,在解决HMM的三个基本问题以后,还谈论了在具体应用时需要考虑的其他问题,如初始模型参数的选取、数据下溢、HMM之间距离的度量等等,并给出了相应的解决方法。
这个语音识别系统是用HMM模型来实现的,用HMM来做语音识别的识别率是很高的,其中用到了HMM的三个算法。(爱毕业设计网 www.2bysj.cn)
关键词:语音识别,HMM
ABSTRACT
The most important part of a recognition system is the acoustic model construction. As a statistic model for signal, HMM can describe the pronunciation signal non-stability and the variability well.
For the sake of understand HMM systematically and apply it to solve real-world problem, this paper introduces the basic theory of HMM and how to use it in the speech recognition. After three basic problem solved,some other important issues in the application, for instance, selecting parameters of the initial model, data over-fitting and the distance degree between HMM, are discussed, then methods for settling those issues are put forward. In addition, it also explains design of the topology and its parameters’ optimization ways.
This recognition system use HMM models come true. It is easier recognizable to use HMM recognize.In this system I use the three arithmetic of HMM.
Keyword: Speech recognition,HMM
绪论
计算机技术的飞速发展,使人与机器用自然语言进行对话的梦想逐渐接近现实。人类的语言在人类的的智能组成中充当着极其重要的角色,人与人之间的交流和沟通70%意商是通过语言的方式有效的完成。作为人与人之间交流最方便、自然、快捷的手段,人们自然希望它成为人与计算机交流的媒介。语音识别就是研究计算机听懂人类语言的一门科学。也是人机交互最重要的一步。进入九十年代之后,出现了诸多实用化的研究方向。
语音识别技术发展到今天,特别是中小词汇量非特定人语音识别系统识别精度已大于98%,对特定人语音识别系统的识别精度就更高。这些技术已经能满足通常应用的要求。由于大规模集成电路技术的发展,这下复杂的语音识别系统也已经完全可以制成芯片,大量生产。在西方经济发达国家,大量的语音识别产品已经进入市场和服务领域。一些电话机、手机已经包含了语音识别拨号的功能,是有语音记事本、语音智能玩具等产品也包括了语音识别与语音合成的功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、旅游、银行信息,并且取得很好的结果。调查统计表明多达85%意商的人对语音识别信息查询服务系统的性能表示满意。可以预测在近五十年内,语音识别系统的应用将更加广泛。各种各样的语音识别系统产品将出现在市场上。人们也将调整自己的说话方式以适应各种各样的识别系统。在短期内还不可能造出具有和人相比拟的语音识别系统,我们只能朝着改进语音识别系统的方向逐渐地前进。
我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室走向实用。从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。
目 录
摘要 ---------------------------------------------------------------------------2
ABSTRACT ------------------------------------------------------------------------2
绪论 ---------------------------------------------------------------------------3
第一章 语音知识基础---------------------------------------------------------------6
第一节 语音识别的基本内容-------------------------------------------6
第二节 语音识别的实现难点-------------------------------------------9
第二章 HMM的理论基础--------------------------------------------------------10
第一节 HMM的定义----------------------------------------------------10
第二节 隐马尔科夫模型的数学描述---------------------------------10
第三节 HMM的类型----------------------------------------------------12
第四节 HMM的三个基本问题和解决的方 -----------------------15
第三章HMM算法实现的问题 ----------------------------------------------21
第一节HMM状态类型及参数B的 选择---------------------------21
第二节HMM训练时需要解决的问题 -----------------------------23
第四章 语音识别系统的设计 ---------------------------------------------------32
第一节 语音识别系统的开发环境-----------------------------------32
第二节 基于HMM的语音识别系统的设计------------------------32
第三节 实验结果---------------------------------------------------------49
第五章 结束语 -------------------------------------------------------------------67
致谢 ------------------------------------------------------------------------------68
参考文献 ------------------------------------------------------------------------69
参考文献
1) 何强 ,何英,MATLAB扩展编程,北京:清华大学出版社 ,2002
2) 杨行竣 ,迟惠生,语音信号数字处理,北京:电子工业出版社,1995
3) Lawrence Rabiner Biing—Hwang Juang 《语音识别基本原理》一影印版北京:清华大学出版社,199
4) 胡航 ,语音信号处理,哈尔滨:哈尔滨工业大学出版社 ,2000(爱毕业设计网 www.2bysj.cn)
5) Jeff Bilmes ,What HMMs Can Do,UWEE Technical Report Number UWEETR-2002-0003,2002
6) Nádas,A decision theoretic formulation of a training problem in speech recognition and a comparison of training by unconditional versus conditional maximum likelihood,IEEE Transactions on Acoustics,Speech and Signal Processing,31,pp814-817,1983
7) LR.Bahl,F.Jelinek, A maximum likelihood approach to continuous speech recognition , IEEE Trans, Pattern Anal.Machine Intell , vol.PAMI-5,pp179-817,1983
8) A.B.Poritz, Liner predictive hidden Markov models and the speech signal, In Proc.ICASSP’82,pp1291-1294,1982
9) B.H.Juang and L.R.Rabiner , Mixture autoregressive Markov models for speech signals ,IEEE Trans, Acoustic Speech Signal Processing ,vol.ASSP-33,no 6 pp1404-1413,1985
10) B.Juang and L.Rabiner, “The segmental k-means algorithm for estimating parameters of hidden Markov models”,in IEEE Transactions on Acoustics, Speech and Signal Processing, volume 38,pp1639-1641,1990
11) S.E.Levinson,L.R.Rabiner and M.M.Sondhi, An introduction to the application of the theory of probabilistic functions of a Markov process to automatic speech recognition, Bell Syet. Tech.J, vol.62, no.4, pp1035-1074,1983