云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > 语音识别开题报告

语音识别开题报告

  • 62 次阅读
  • 3 次下载
  • 2026/1/12 5:43:20

前在单字和词组级上,合成语音的可懂度和自然度已基本解决,但是对于句子乃至篇章级,其自然度问题就比较大。未来的文语转换系统的发展趋势是采用基于语境相关的合成思想进行设计,能够将发音人的原始发音特征最大限度地保留下来,辅助以先进的层次化语言韵律模型,通过分散统计的模型方法来涵盖语义语音之间的内在联系,使系统能够输出具有高自然度和表现力的合成语音。但是,在目前的合成系统中,普遍存在合成输出语音的机器味比较浓、语境的知识层次模型研究不完善等问题。因此 获得高自然度、 具有表现力的合成语音,也是今后语音技术的研究目标之一 。

1.3.3 语音技术与多媒体技术的结合

伴随着现代语音技术的不断发展,人类对语音信号的需要已经不仅仅停留在可懂性和正确性上,语音合成技术的研究方向已是合成语音的美感并同时输出辅助的视频特征,实现虚拟主持人的效果,通过将视觉效果包括人的头部建模、唇形同步技术和表情因素等视频信息的加入,可以更好地体现语音合成系统的表现力和感染力。因此,我们完全有理由相信,语音技术和多媒体技术的有机结合将使合成系统展现出广阔的应用前景。

1.3.4 语音技术与网络技术的结合

目前,语音技术已逐渐应用于电信的声讯信息服务领域和互联网消息收发方面。随着电话网与互联网的融合、网络信息项目的增多和时效性要求逐步提高,建立适合于股票交易、航班动态查询、电话自动报税等业务的语音系统成为可能,电话用户可以通过传统的语音、传真获取互联网上无穷无尽的信息。这些业务将彻底解决传统数字录音回放技术所无法解决的海量信息库和动态变化信息的实时生成与存储的难题。因此,将语音技术与网络进行完美的结合具有强大的生命力 。

1.3.5 多语种

语言是人们交流的工具,不同民族有自己不同的语言,不同语言之间的交流在今天开放的信息社会和网络时代显得十分重要,因此,多语种的文语合成有着独特的应用价值。例如,在自动电话翻译、有声电子邮件等应用中都提出了多语种语音合成的需求,即使是对汉语合成也有多方言文语转换问题。理想的多语种合成系统最好是各种语言共用一种合成算法或语音合成器,但现有的语音合成系统大多是针对某一种语言或若干种语言开发出来的,所采用的算法及规则都是与某种语言密切相关的,因此很难推广到其他语种。如汉语和西方语言之间存在着很大的差异,而目前国内的系统都是做汉语英语转换的,其韵律控制规则完全不适合于英语,而且它们主要是合成汉语普通话的,即使推广到广东话和上海话都有相当的难度。

可见要真正解决多语种的文语合成,从文本处理到语音合成都必须有新的思路,因此,研制多语种语音合成转换系统具有重要的理论和现实意义。

4

二 主要研究内容和方法

语音识别技术是利用计算机对语音进行特征提取,获取最能表征语音特征的有用信息,根据这些信息来对语音所代表的内容或说话人身份判断的技术。因此需要对语音波形的幅值、频率等特点进行研究,我们把语音识别的研究内容大致可以分为语音提取,特征提取,语音识别,内容分析,内容匹配。

在特征提取之前,一个重要的问题是消除噪音、空白音及音长不同的影响。根据语音识别技术的发展历史,语音识别方法大致可分为基于说话人的语音识别方法、基于说话内容的语音识别方法、基于统计的语音识别方法和基于网络的语音识别方法。

三 基本设计要求及设计思路

3.1 语音识别系统原理

使用C语言编程,实现基于马尔科夫模型的数据特征提取,在此基础上编程实现特定语音实例的语音识别;将语音识别功能编写成可供其他模块调用的函数,为进一步实现语音识别系统提供基础;并且从中培养、提高查阅文献和综合运用知识的编程开发能力。

语音识别本质上是一种模式识别的过程,未知语音的模式与已知语音的参考模式逐一进行比较,最佳匹配的参考模式被作为识别结果。图1是基于模式匹配原理的自动语音识别系统原理框图。

图1 语音识别系统原理框图

(1)预处理模块:对输入的原始语音信号进行处理,滤除掉其中的不重要的信息以及背景噪声,并进行语音信号的端点检测、语音分帧以及预加重等处理。

(2)特征提取模块:负责计算语音的声学参数,并进行特征的计算,以便提取出反映信号特征的关键特征参数用于后续处理。现在较常用的特征参数有线性预测(LPC)参数、线谱对(LSP)参数、LPCC、MFCC、ASCC、感觉加权的线性预测(PLP)参数、动态差分参数和高阶信号谱类特征等[1]。其中,Mel频率倒谱系数(MFCC)参数因其良好的抗噪性和

5

语音信号 预处理 输入 特征提取 训练 参考模式库 模式匹配 判别规则 识别结果

鲁棒性而应用广泛。

(3)训练阶段:用户输入若干次训练语音,经过预处理和特征提取后得到特征矢量参数,建立或修改训练语音的参考模式库。

(4)识别阶段:将输入的语音提取特征矢量参数后与参考模式库中的模式进行相似性度量比较,并结合一定的判别规则和专家知识(如构词规则,语法规则等)得出最终的识别结果。

3.2 语音识别的几种基本方法

当今语音识别技术的主流算法,主要有基于动态时间规整(DTW)算法、基于非参数模型的矢量量化(VQ)方法、基于参数模型的隐马尔可夫模型(HMM)的方法、基于人工神经网络(ANN)和支持向量机等语音。

按照该过程,首先实现用MATLAB编程的过程,然后将具体MATLAB的程序用C语言改写,以便于在系统间进行移植等。

四 预期的课题进度计划

第1周---第2周:查阅、学习相关文献资料,完成文献综述。

第3周---第6周:了解基于马尔科夫模型语音数据特征提取及语音数据特征识别的基 本原理;学习所需的C语言编程技术;进行初步的实验编程。

第7周---第9周:在初步的原理实验通过后,根据具体的应用要求,编写、调试功能较为全面的语音识别程序;实现基本的 特征提取、识别功能。

第10周---第12周:进一步优化程序,实现具有实用功能的应用程序,完成外文文献译稿。

第13周---第14周:系统及程序测试,进行系统的输入,处理,输出全面测试。进行实验报告总结,撰写论文,完成毕业设计初稿。

第15周:整理完成程序设计说明书,完善所有设计图纸及程序,准备答辩。

五 参考文献

[1]胡光锐,语音处理与识别,上海科学技术文献出版社,1994. [2]赵立,语音信号处理,机械工业出版社,2003.

[3]程佩青,数字信号处理教程(第三版),清华大学出版,2007.

6

[4] 拉宾纳 L,Rabiner Lawrence,阮平望, Juang Biing-Hwang, 语音识别基本原理, 清华大学出版社, 1999.

[5] 王炳锡,屈丹,彭煊,实用语音识别基础[M].北京:国防工业出版社,2005. [6] 詹新明,黄南山,杨灿.语音识别技术研究进展[J].现代计算机,2008.

[7] 高新涛,陈乖丽,语音识别技术的发展现状及应用前景[J].甘肃科技纵横,2007.

7

搜索更多关于: 语音识别开题报告 的文档
  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
推荐下载
本文作者:...

共分享92篇相关文档

文档简介:

前在单字和词组级上,合成语音的可懂度和自然度已基本解决,但是对于句子乃至篇章级,其自然度问题就比较大。未来的文语转换系统的发展趋势是采用基于语境相关的合成思想进行设计,能够将发音人的原始发音特征最大限度地保留下来,辅助以先进的层次化语言韵律模型,通过分散统计的模型方法来涵盖语义语音之间的内在联系,使系统能够输出具有高自然度和表现力的合成语音。但是,在目前的合成系统中,普遍存在合成输出语音的机器味比较浓、语境的知识层次模型研究不完善等问题。因此 获得高自然度、 具有表现力的合成语音,也是今后语音技术的研究目标之一 。 1.3.3 语音技术与多媒体技术的结合 伴随着现代语音技术的不断发展,人类对语音信号的需要已经不仅仅停留在可懂性和正确性上,语音合成技术的研究方向已是合成语音的美感并同时输出辅助的视频特征,实现虚拟主持人的效果,通过将视觉效果

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com