云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > 声纹识别

声纹识别

  • 62 次阅读
  • 3 次下载
  • 2025/6/17 12:35:07

数,其计算过程如下:

1、 将信号进行短时傅里叶变换得到其频谱

2、 求频谱幅度的平方,即能量谱,并用一组三角滤波器在频域对能量进行带通滤波,这组带通滤波器的中心频率是按Mel频率刻度均匀排列的。 3、 对滤波器的输出取对数,然后做2M点傅里叶逆变换即的MFCC,由于对称性,此变换可简化为

(3)

这里,MFCC系数的个数L通常取最低的12~16.在谱失真测度定义中通常不用0阶倒谱系数,因为它是反映倒谱能量的。

4.2.2 模型二

隐马尔可夫过程是一个双重随机过程:一重用于描述非平稳信号的短时平稳段的停机特征;另外一重随机过程描述了每个短时平稳段如何转变到下一个短时平稳段,即短时统计特征的动态特征。基于这两重随机过程,HMM即可有效解决怎么样辨识具有不同参数额短时平稳信号段,又可解决怎么样追踪他们之间的转化等问题。

人的言语过程也是这样一个双重随机过程。因为语音信号本身是一个可观察的序列,而它有事由大脑里的、根据言语需要和语法知识所发出的音素的参数流,同时,大量数据表明,HMM的确可以非常准确的描述语音信号的产生。 一个隐马尔可夫模型由下列参数来决定:

1、N,即模型的状态数目,虽然HMM的状态是隐藏起来的,但在许多实际应用中,模型的状态常常有某种物理意义,状态的集合表示为S={S1,S2,…,SN},t时刻的状态表示为qt

2、M,即观测符号数,集合表示为O={O1,O2,O3,…,OM} 3、A,状态转移概率分析,这是由状态转移概率构成的矩阵

A={aij},aij=P[qt+1=Sj|qi=Si],1£i,j£N

其中aij30,?aj=1Nij=1

4、B,状态Sj的观测符号概率分布 5、,状态初始分布

P={Pi},Pi=P[qi=Si],1£j£N

为了完整地描述一个隐马尔可夫模型,应当指定状态数N,观测符号M,以及三个概率密度A、B和P。这些参数之间有一定的联系,因此为了方便,HMM常用l=(A,B,p)来简记。

给定HMM的形式后,为了将其应用于实际,必须解决以下三个基本问题。 1、 已知观测序列O={O1,O2,…,Ot}和模型l=(A,B,p),如何有效的计算在给定模型条件下产生观测序列O的概率P(O|l)

2、 已知观测序列O={O1,O2,…,Ot}和模型l=(A,B,p),如何选择响应的某种意义上最佳的状态序列

3、 给定观测序列,如何调整参数(A,B,p)使得概率P(O|l)最大 4、

五、模型求解

首先针对模型一,即Mel频率倒谱系数模型。MFCC参数的提取流程具体分为预加重和加窗分帧,快速傅里叶转换、三角带通滤波器,离散余弦转换

对输入的数学语音信号进行预加重,其目的是为了对语音的高频部分进行加重,去处口唇辐射的影响,增加语音的高频分辨率。一般通过传递函数为

H(z)=1-az-1 (4)

的一阶FIR高通数字滤波器来实现预加重,其中a为预加重系数,

设n时刻的语音采样值为x(n),经过预加重处理后的结果为y(n)=x(n)-ax(n-1) 这里取a=0.98,实现高频提升的matlab程序见附录1

进行预加重数字滤波处理后,接下来进行加窗分帧处理,语音信号是一种随时间而变化的信号,主要分为浊音和清音两大类,浊音的基音周期、清浊音信号幅度和声道参数等都随时间变化而缓慢变化。语音的分帧是采用可移动的有限长度窗口进行加工权的方法来实现的。

常见的窗有两种,一种矩形窗,一种汉明窗,这里使用汉明窗,函数如下

这种窗的时域和频域波形可用matlab程序实现,见附录4

时变傅里叶变换是时间n的函数,当n变化是,窗w(n-m)沿着x(m)滑动。由功率谱定义,可以写出短时功率谱与短时傅里叶变换的关系

功率谱Sn是自相关函数

的傅里叶变换,其matlab程序见附录5

三角带通滤波器,设定16KHz 和 8KHz条件下的滤波器数组 melf16[],melf8[]。melf[]滤波器数组为20×129的稀疏矩阵,以结构化数组的方式存储。计算每个滤波器输出的对数能量z[20],计算公式为:z[ ] = log ( melf[]*(|X(0:128)|.^2) )

对上一步所获得的对数能量进行DCT变换,获得DCT系数数组r[20] r[] = dct (z[ ]); dct()变换公式为

,D = 20

r[] 即一帧语音信号的MFCC参数

计算并保存所有各帧语音信号的MFCC参数。 针对模型二, l=(A,B,p)

在上文提到的三个问题进行解答,针对第一个问题, 首先定义一个前向向量,

初始化

迭代计算

最后计算

后向计算,

同理定义后向向量

初试哈

迭代计算

最后计算

对于该问题求解,也可以同时使用前向后向来求解,即

针对第二个问题,该问题是求取伴随给定观测序列产生的最佳状态序列,首先定义变量

用前后向量表示为

可得最佳状态

初试话

迭代计算

最后计算

路径回溯

搜索更多关于: 声纹识别 的文档
  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
推荐下载
本文作者:...

共分享92篇相关文档

文档简介:

数,其计算过程如下: 1、 将信号进行短时傅里叶变换得到其频谱 2、 求频谱幅度的平方,即能量谱,并用一组三角滤波器在频域对能量进行带通滤波,这组带通滤波器的中心频率是按Mel频率刻度均匀排列的。 3、 对滤波器的输出取对数,然后做2M点傅里叶逆变换即的MFCC,由于对称性,此变换可简化为 (3) 这里,MFCC系数的个数L通常取最低的12~16.在谱失真测度定义中通常不用0阶倒谱系数,因为它是反映倒谱能量的。 4.2.2 模型二 隐马尔可夫过程是一个双重随机过程:一重用于描述非平稳信号的短时平稳段的停机特征;另外一重随机过程描述了每个短时平稳段如何转变到下一个短时平稳段,即短时统计特征的动态特征。基于这两重随机过程,HMM即可有效解决怎么样辨识具有不同参数额短时平稳信号段,又可解

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com