当前位置:首页 > 声学(1)-李俞增
5.声干涉
如果频率和振动方向相同,且相位差恒定的两列声波在空间相遇,它们不是彼此抵消就是彼此加强,这种现象称为声的干涉.
6.多普勒效应
当声源相对于波的传播媒质而运动,或观察者相对于媒质而运动,或声源和观察者彼此间以及与媒质有相对运动时,观察者检测到的声源频率将不同于声源所发声波的实际频率,这种现象称为多普勒效应.
观察者听到的声波频率是
其中f为声源原来的频率,v是观察者相对于媒质的速度,u是声源相对于媒质的速度.利用多普勒效应可以测定一些运动物体的速度.
坐火车的人都有这样的经验,当一列鸣笛的火车相对我们呼啸而过时,声音由低变高再重新变低,这就是多普勒效应的最简单的例子.
3听觉、语言和音乐
经过长期的发展进化,人生来便具有精细的发音器官和听觉器官.一个人从呱呱坠地时起,便与声学终生密切相关.语言是人类最重要的交际工具.语言也是人类的思维工具.通过语言人们可以传递信息交流思想,增强相互交往,促进社会进步.音乐是人类文化生活中最重要的组成部分.语言和音乐都是通过声波的形式来体现的.人的听觉器官是最灵敏的声音接收器.所以,听觉、语言和音乐是人类最早开始研究的声学问题.
在近代信息社会的发展中,人们创造出了各种信息机器,用以延伸人类天生的器官.人工智能研究的成果,将逐渐使电子计算机成为名副其实的“电脑”.当前,国际上努力实现
的人类长期的幻想——人机语言通讯系统,使声学研究进入了一个新阶段.电子乐器,计算机作曲,机器演奏的交响乐,使音乐世界更加丰富多彩.这些都是近代声学的热门课题.
3.1听觉
双耳是人的听觉器官,它非常灵敏.人的听觉能感受到的最小声压已接近于空气中分子热运动所产生的声压,能感受的频率范围约为20Hz~20000Hz,宽达十个倍频程(即十个“八度”).人耳能感受的强度范围约为10-12W·m-2~1W·m-2,大小相差1012倍.
1.级和分贝
在声学中声音的强度或压力常用级来表示,它的单位是dB(分贝),见式(5.5)及式(5.6).这样上面说到的人耳能听到的最小的声音与最大声音之间强度相差1012倍,也就是声级相差120dB.
2.响度和响度级
一个声音在听觉感受上有多响,并不与这个声音的物理强度成线性关系.所以在普通声学中,除了有一套物理量之外,与之对应的还有一套心理量,用以表示声音在主观感受上的程度.一个声音有多响除了与它的强度大小有关外,还与它的频率高低有关.根据世界上许多国家对不同种族的大量正常人所测得的响度级与声压级和频率的关系,称为等响曲线,示于图5-4.
响度级的单位是phon(方).一个声音的响度级等于等响的1000Hz纯音的声压级.与人的感受成正比的声音大小的量称为响度.响度的单位是sone(宋).它是以响度级为40phon的声音的响度为1sone来定义的.两倍响即为2sone.实验表明,响度级每增加10phon,响度增加一倍.
3.音调
一个声音在听觉感受上有多高,主要与它的频率有关,但是它的强度也起很大作用.如果一个声音里包含许多频率成分,它的音调高低就更复杂.
音调高低的心理标度单位为mel(美).它是以1000Hz,40phon的纯音的音调作基准,定为1000mel.要是一个纯音听起来比它高一倍,即为2000mel,要是低一半就是500mel,依此类推.
4.双耳效应
人们判断声源的方向与距离,要靠两个耳朵来接收,特别是觉察声源运动,从嘈杂的环境中倾听一个较弱的声音等,靠的都是两个耳朵的功能,这称之为双耳效应.人们熟知的立体声就是利用双耳效应.双耳效应的主要作用,来自于声音到达两个耳朵的时间差.头部左右转动,可以提高声音定位的准确程度.在有混响的地方,如音乐厅、电影院,定位只依赖最先听到的声音在两耳的时间差,这是立体声系统的根据.
3.2语言
语言首先是有声语言,是与人类同时发展进化而来的.人的发音器官也是一具复杂而灵巧的机器,它主要是说话和唱歌,当然也可以发出各种声音.发音器官由肺、气管、声门、咽腔、口腔和鼻腔等构成.口腔中又有非常灵活的舌头.上腭、软腭、上下齿和双唇等部件.肺是能源,声门由声带振动调制气流使成交变信号.再经过声道(口腔、鼻腔、咽腔)加以滤波形成不同的简正振动方式,由口和鼻(如果是鼻音的话)辐射到空气环境中便是语音了.
语言是由语音(包括元音和辅音)按一定规则编排组合而成.在声学上来看,不同的语音特征,体现在它们具有不同的时间-频率特性上.
1.语言频谱和动态范围
人们日常谈话辐射的声功率平均约为10mW,耳语时最低声功率只有0.001mW;有训练的歌唱家最高可能产生1W的功率.所以语言信号的功率是不大的,可是它所能传递的信息是无限的.
语言频谱有两种,其一是表示语言整体长时平均特性的长时平均频谱.从现有的多种语言的测量结果来看,各种语言的长时平均频谱是大同小异的.语言信号的频带约在100Hz~10000Hz,主要频段约为100Hz~4000Hz.不传送基音的电话语言则定为300Hz~3400Hz.在每个频带之中语言信号的动态范围约为30dB.再加上不同频带之间低频最强的频率成分(约在300Hz附近)与高频最弱的频率成分还要有30dB~40dB的差别.
标准的正常说话声级,在距发音人唇部一米处的声级约为65dB(男人高些,女人低些).
语言的另一种频谱是短时频谱.发音是一个连续慢变过程.用短时频谱来表示不同语音的声学特征.从声源看,语音声源可分为:准周期激励、噪声激励和脉冲激励三种.有的语音是由它们三者的某种组合构成的,如浊辅音就可能是由第一种准周期激励(声带振动),再加上第二种或第三种噪声激励所构成(如汉语的浊声母r,英语的浊辅音b、d、g).
由于声道的不同形状可产生出不同语音,也就有不同的简正方式,表现在语音短时频谱上,称之为共振峰.
2.语言合成与语言识别
人们早就向往着让机器说话和听话.我国的“封神演义”和西方的“天方夜谭”都有着这种幻想.有文献记载,我国唐代就曾有过用木头做的托钵僧,可以发出“布施”的音来.这可以说是世界上最早的会说话的机器.18、19世纪西方也有用机械方法合成语音的.直到1939年才出现第一架采用电子线路的发音演示器.其工作原理是利用电子线路来模拟语
共分享92篇相关文档