1) Psychoacoustic model
心理声学模型
1.
Improvement of AAC psychoacoustic model based on CMDCT;
基于CMDCT的AAC编码器心理声学模型的改进
2.
Algorithm of hiding image in audio based on psychoacoustic model;
基于心理声学模型的音频隐藏图像算法
3.
A robust audio watermarking algorithm using psychoacoustic model;
一种应用心理声学模型的鲁棒音频水印算法
2) psychoacoustics model
心理声学模型
1.
A speech quality evaluation algorithm based on efficient psychoacoustics model,EPM-SQE,was proposed.
提出了一种高效心理声学模型语音质量评价(EPM-SQE)算法。
2.
It contributes 3 simplifications to the psychoacoustics model in ITU-T P.
分析了国际电信联盟提出的语音质量感知评价算法的原理,优化了其中的心理声学模型,提出了高效语音质量感知评价(EPESQ)算法。
3) psycho-acoustic model
心理声学模型
1.
Modifications to a tonality detection algorithm in psycho-acoustic model;
心理声学模型中音调探测算法的改进
2.
This paper presents the function, fundamental principle and algorithm flow of the psycho-acoustic model, which is one of the most important parts of MPEG-4 Advanced Audio Coding (AAC).
心理声学模型是MPEG-4AAC音频编码器中最重要的部分之一。
3.
The masking threshold for each audio signal segment was calculated on the basis of psycho-acoustic model.
首先根据心理声学模型 ,计算载体音频信号的掩蔽门限 ,并利用人耳听觉的临界频率与小波包子带间的相似特性 ,将DFT域掩蔽门限映射到小波包域 ;然后将水印信号嵌入到中低频小波包系数中 ,嵌入强度由掩蔽门限自适应控制。
6) parametric psychoacoustic model
参数心理声学模型
1.
A parametric psychoacoustic model based on critical band rate, level dependent spreading function, non linear superposition and forward masking was proposed.
提出了基于临界频带率、依赖于强度的扩展函数、非线性迭加和前向掩蔽效应的参数心理声学模型 。
补充资料:心理声学
研究声音和它引起的听觉之间关系的一门边缘学科。它既是声学的一个分支,也是心理物理学的一个分支。心理声学本可包括言语和音乐这样一些复合声和它们的知觉。这些可见语言声学、音乐声学等条,本条只限于较基础和简单的心理声学现象,即①刚刚能引起听觉的声音──听阈;②声音的强度、频率、频谱和时长这些参量所决定的声音的主观属性──响度、音调、音色和音长;③某些和复合声音有关的特殊的心理声学效应──余音、掩蔽、非线性、双耳效应。
听阈 听阈分强度阈和差阈。声音不够一定强度不能引起听觉。在多次作用中能有50%的次数引起听觉的最小声压级称为强度阈(也称听阈)。听阈有个体差异,因而所谓正常听阈只能是一些听力正常的年轻人的听阈的统计平均值。听阈随频率而变化。500~4000Hz之间阈值最低,在它们之上和之下的高频声和低频声的阈值都较高,如20Hz纯音的阈值比1000Hz纯音的阈值约高70dB,10000Hz纯音的阈值也比 1000Hz纯音的阈值约高10dB。最敏感的频率是3000Hz左右,空气分子振动的振幅达到10-11m 就可以听到,这只有氢气分子的直径的十分之一。听阈随年龄而增高,特别是高频部分,表现为老年聋,如70岁的老人,5000Hz纯音的听阈约增高45dB。
听阈的概念还包括差阈,即两个声音引起听觉差别的最小可觉差。就频率说,在63Hz左右有经验的人耳能区别相差0.5Hz的两个纯音的差别,但这种阈值在1000Hz要增加到1.4Hz,频率越高差阈越大。人耳能区别的强度差值最小0.25dB(1000~4000Hz,70dB以上),强度低或频率更高或更低时,强度差阈更大。在整个听觉范围内,可辨别的声音约34万个。
声音的主观属性 响度 表示的是一个声音听来有多响的程度。响度主要随声音的强度而变化,但也受频率的影响。两者的量的关系,按古典的心理物理学规律,响度与强度的对数成正比。为了检验这一假说的正确性,现代心理物理学进行了响度的定量判断实验,并建立了响度量表,其单位为宋(son)。1宋的定义为40dB1000Hz纯音所引起的响度,大致相当于耳语的声级。宋量表证明,响度正比于 1000Hz等响声压的0.6次幂,就是说,1000Hz等响声的声压级提高10dB,响度加倍。前者称为响度级,这说明响度的变化不是单纯地决定于声音强度,也与频率有关。不同频率的两个纯音,虽强度相同,引起的响度却不同。总的说,中频纯音听来比低频和高频纯音响一些。以不同声压级的1000Hz纯音为参照声,通过响度平衡实验,可以得到一簇等响线,如上图所示。在一条等响线上,各频率的纯音尽管声压级不同,但都与该曲线上的1000Hz纯音等响。1000Hz纯音的这一声压级即定为此曲线上各纯音的响度级,其单位称为方(phon)。
音调 音调是声音听来调子高低的程度。音调主要决定于声音的频率,它随频率的升降而升降。但是,它也不是单纯地由频率决定,与声音强度也有关系。低频纯音的音调随强度增加而下降;反之,高频纯音的音调却随强度增加而上升。类似响度的宋量表,也制定了音调量表。音调定量判断实验是让听者调节发生器产生一系列纯音,使它们在音调上听来间隔相等。这样取得的平均判断构成了音调量表,其单位称为美。在此量表上,1000Hz纯音的音调被定为1000美(mel)。
音色 音色是对声音音质的感觉。上面提过的纯音不存在音色问题,它是伴随复合声出现的。明显的例子是不同乐器所发出的声音在音色上的不同。小提琴和钢琴发出的中央C,尽管它们响度和音调相同,听起来还是不一样,原因在于它们音色的差异。声音的音色决定于它们的频谱,即声音谐波振幅的不同。复合声这种多量纲的特点使得音色也具有多量纲性,不同于只有单个量纲的响度和音调。响度可以在宋量表上定出由响到轻的程度,音调可以在美量表上定出由高到低的程度,音色则只能用多维空间上相应的点来确定。言语声的多维量表实验证明,音色的知觉空间上的点与频谱的物理空间上的点是非常吻合的。
音长 音长是声音长短的感觉。声音的参量作为时间的函数只要有两个清楚的变化便可产生主观音长感觉。最简单的例子是一个声脉冲或一段休止,它们都只有一头一尾的变化。很久以来,人们总以为音长和声音的物理长短是相等的,忽视了对它的研究。其实,在极端情况下两者可相差四五倍之多。这是用脉冲声和短于 500ms的休止所作的实验结果。音长受声级的影响不大,但频率对它的影响却不可忽视,尤其是300ms以下的短声。如果以3 200Hz的脉冲声作参照,频率在它上下的脉冲声必须有较长的物理声长才能产生相等的音长感觉。用这种音长平衡实验可以得到一簇类似于等响线的等音长线。
心理声学效应 余音 对于纯音, 声音的音调主要决定于频率, 而对于由基波和谐波组成的复合声,自H.von亥姆霍兹以来,普遍认为复合声的音调决定于基波的频率,因为基波的振幅在频谱中占优势,而且给人的感觉也的确如此。但是实验表明,若复合声的基频很弱,甚至完全被滤掉,它的音调仍维持基频的音调不变。这种失去基频的音调被称为余音。日常生活中也有余音效应。人们的言语声是以声带发出的低频声为基频的。在电话中,它虽然被滤掉,说话的声调并没有受到影响。余音现象所以受到注意是因为它涉及到一个基本的听觉理论问题,即音调究竟决定于频率,还是决定于周期性。目前的研究还不能作出结论。
声掩蔽 一个声信号如果与一种噪声同时出现,它将变得微弱或完全听不清楚,即是说信号的听阈提高了。这就是掩蔽效应,噪声掩蔽了信号。掩蔽效应的大小取决于噪声和信号在频率上的关系。一般说,信号与噪声的频率越接近,掩蔽也越大,且低频噪声对高频信号的掩蔽常大于高频噪声对低频信号的掩蔽。通过带宽可变的噪声对纯音信号的掩蔽实验发现,当以 1000Hz为中心频率的噪声增加带宽时,它对 1000Hz纯音信号的掩蔽效应也随着增加。但带宽增至100Hz以后,再增加就对掩蔽的改变不起作用。就是说,这个噪声的掩蔽作用只限制在这个频带内,以外的声音无作用。这个100Hz的频带称为临界频带。它随频率的提高而加宽。
非线性 人耳的传输特性与其他换能器一样,带有一些非线性的特点。它的产物就是所谓"合音"的感觉。合音包括差音、和音两种。差音的例子:当两个纯音同时以400Hz和500Hz同时发出时,仔细听起来还有频率为其差值(100)及其谐频的差值(200,300)的音,这就是差音。和音的频率则是原来两纯音频率之和,在这一例子中就是900Hz。它与差音相似,不过较弱一些,音调高一些。此外,还有在适当频率和强度关系下一个音可以抑制或降低另一个音的响应(感觉)。这些现象一般用耳蜗的非线性反应解释。
双耳效应 很多听觉效果, 决定于人有两只耳朵。声源定位的主要因素为两耳的时间差和强度差(见生理声学)。由于头部、耳廓、外耳道等的共振、反射作用,使听到的声音频谱受到调制。来自右边的声音先到达右耳,强度也比左耳收到的强。声源方向常通过头的转动确定。复合声的定位比纯音容易,纯音,尤其是2000~3000Hz的纯音, 定位特别困难。例如蟋蟀的唧唧声就是这样, 虽然它还不是严格的纯音。在可听声范围内,耳廓的指向性不显著,但对定位仍有作用。在低频率,两耳强度差别不大, 定位主要靠相位因素或时间因素。在高频率, 相位变化复杂,强度差更为重要。在中频,定位更依赖时间和强度的综合作用。
参考书目
G.von Békésy, Experiments in Hearing, McGraw-Hill,New York,1960.
J.O.Pickles, An Introduction to the Physiology of Hearing, Academic Press, London, 1982.
听阈 听阈分强度阈和差阈。声音不够一定强度不能引起听觉。在多次作用中能有50%的次数引起听觉的最小声压级称为强度阈(也称听阈)。听阈有个体差异,因而所谓正常听阈只能是一些听力正常的年轻人的听阈的统计平均值。听阈随频率而变化。500~4000Hz之间阈值最低,在它们之上和之下的高频声和低频声的阈值都较高,如20Hz纯音的阈值比1000Hz纯音的阈值约高70dB,10000Hz纯音的阈值也比 1000Hz纯音的阈值约高10dB。最敏感的频率是3000Hz左右,空气分子振动的振幅达到10-11m 就可以听到,这只有氢气分子的直径的十分之一。听阈随年龄而增高,特别是高频部分,表现为老年聋,如70岁的老人,5000Hz纯音的听阈约增高45dB。
听阈的概念还包括差阈,即两个声音引起听觉差别的最小可觉差。就频率说,在63Hz左右有经验的人耳能区别相差0.5Hz的两个纯音的差别,但这种阈值在1000Hz要增加到1.4Hz,频率越高差阈越大。人耳能区别的强度差值最小0.25dB(1000~4000Hz,70dB以上),强度低或频率更高或更低时,强度差阈更大。在整个听觉范围内,可辨别的声音约34万个。
声音的主观属性 响度 表示的是一个声音听来有多响的程度。响度主要随声音的强度而变化,但也受频率的影响。两者的量的关系,按古典的心理物理学规律,响度与强度的对数成正比。为了检验这一假说的正确性,现代心理物理学进行了响度的定量判断实验,并建立了响度量表,其单位为宋(son)。1宋的定义为40dB1000Hz纯音所引起的响度,大致相当于耳语的声级。宋量表证明,响度正比于 1000Hz等响声压的0.6次幂,就是说,1000Hz等响声的声压级提高10dB,响度加倍。前者称为响度级,这说明响度的变化不是单纯地决定于声音强度,也与频率有关。不同频率的两个纯音,虽强度相同,引起的响度却不同。总的说,中频纯音听来比低频和高频纯音响一些。以不同声压级的1000Hz纯音为参照声,通过响度平衡实验,可以得到一簇等响线,如上图所示。在一条等响线上,各频率的纯音尽管声压级不同,但都与该曲线上的1000Hz纯音等响。1000Hz纯音的这一声压级即定为此曲线上各纯音的响度级,其单位称为方(phon)。
音调 音调是声音听来调子高低的程度。音调主要决定于声音的频率,它随频率的升降而升降。但是,它也不是单纯地由频率决定,与声音强度也有关系。低频纯音的音调随强度增加而下降;反之,高频纯音的音调却随强度增加而上升。类似响度的宋量表,也制定了音调量表。音调定量判断实验是让听者调节发生器产生一系列纯音,使它们在音调上听来间隔相等。这样取得的平均判断构成了音调量表,其单位称为美。在此量表上,1000Hz纯音的音调被定为1000美(mel)。
音色 音色是对声音音质的感觉。上面提过的纯音不存在音色问题,它是伴随复合声出现的。明显的例子是不同乐器所发出的声音在音色上的不同。小提琴和钢琴发出的中央C,尽管它们响度和音调相同,听起来还是不一样,原因在于它们音色的差异。声音的音色决定于它们的频谱,即声音谐波振幅的不同。复合声这种多量纲的特点使得音色也具有多量纲性,不同于只有单个量纲的响度和音调。响度可以在宋量表上定出由响到轻的程度,音调可以在美量表上定出由高到低的程度,音色则只能用多维空间上相应的点来确定。言语声的多维量表实验证明,音色的知觉空间上的点与频谱的物理空间上的点是非常吻合的。
音长 音长是声音长短的感觉。声音的参量作为时间的函数只要有两个清楚的变化便可产生主观音长感觉。最简单的例子是一个声脉冲或一段休止,它们都只有一头一尾的变化。很久以来,人们总以为音长和声音的物理长短是相等的,忽视了对它的研究。其实,在极端情况下两者可相差四五倍之多。这是用脉冲声和短于 500ms的休止所作的实验结果。音长受声级的影响不大,但频率对它的影响却不可忽视,尤其是300ms以下的短声。如果以3 200Hz的脉冲声作参照,频率在它上下的脉冲声必须有较长的物理声长才能产生相等的音长感觉。用这种音长平衡实验可以得到一簇类似于等响线的等音长线。
心理声学效应 余音 对于纯音, 声音的音调主要决定于频率, 而对于由基波和谐波组成的复合声,自H.von亥姆霍兹以来,普遍认为复合声的音调决定于基波的频率,因为基波的振幅在频谱中占优势,而且给人的感觉也的确如此。但是实验表明,若复合声的基频很弱,甚至完全被滤掉,它的音调仍维持基频的音调不变。这种失去基频的音调被称为余音。日常生活中也有余音效应。人们的言语声是以声带发出的低频声为基频的。在电话中,它虽然被滤掉,说话的声调并没有受到影响。余音现象所以受到注意是因为它涉及到一个基本的听觉理论问题,即音调究竟决定于频率,还是决定于周期性。目前的研究还不能作出结论。
声掩蔽 一个声信号如果与一种噪声同时出现,它将变得微弱或完全听不清楚,即是说信号的听阈提高了。这就是掩蔽效应,噪声掩蔽了信号。掩蔽效应的大小取决于噪声和信号在频率上的关系。一般说,信号与噪声的频率越接近,掩蔽也越大,且低频噪声对高频信号的掩蔽常大于高频噪声对低频信号的掩蔽。通过带宽可变的噪声对纯音信号的掩蔽实验发现,当以 1000Hz为中心频率的噪声增加带宽时,它对 1000Hz纯音信号的掩蔽效应也随着增加。但带宽增至100Hz以后,再增加就对掩蔽的改变不起作用。就是说,这个噪声的掩蔽作用只限制在这个频带内,以外的声音无作用。这个100Hz的频带称为临界频带。它随频率的提高而加宽。
非线性 人耳的传输特性与其他换能器一样,带有一些非线性的特点。它的产物就是所谓"合音"的感觉。合音包括差音、和音两种。差音的例子:当两个纯音同时以400Hz和500Hz同时发出时,仔细听起来还有频率为其差值(100)及其谐频的差值(200,300)的音,这就是差音。和音的频率则是原来两纯音频率之和,在这一例子中就是900Hz。它与差音相似,不过较弱一些,音调高一些。此外,还有在适当频率和强度关系下一个音可以抑制或降低另一个音的响应(感觉)。这些现象一般用耳蜗的非线性反应解释。
双耳效应 很多听觉效果, 决定于人有两只耳朵。声源定位的主要因素为两耳的时间差和强度差(见生理声学)。由于头部、耳廓、外耳道等的共振、反射作用,使听到的声音频谱受到调制。来自右边的声音先到达右耳,强度也比左耳收到的强。声源方向常通过头的转动确定。复合声的定位比纯音容易,纯音,尤其是2000~3000Hz的纯音, 定位特别困难。例如蟋蟀的唧唧声就是这样, 虽然它还不是严格的纯音。在可听声范围内,耳廓的指向性不显著,但对定位仍有作用。在低频率,两耳强度差别不大, 定位主要靠相位因素或时间因素。在高频率, 相位变化复杂,强度差更为重要。在中频,定位更依赖时间和强度的综合作用。
参考书目
G.von Békésy, Experiments in Hearing, McGraw-Hill,New York,1960.
J.O.Pickles, An Introduction to the Physiology of Hearing, Academic Press, London, 1982.
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条