说明:双击或选中下面任意单词,将显示该词的音标、读音、翻译等;选中中文或多个词,将显示翻译。
您的位置:首页 -> 词典 -> 语音音质客观评价
1)  objective speech quality evaluation
语音音质客观评价
2)  objective assessment of speech quality
语音质量客观评价
1.
Study on the Applications of Neural Networks in Objective Assessment of Speech Quality;
神经网络在语音质量客观评价应用中的研究
3)  speech objective assessment
语音客观评价
4)  objective quality evaluation
客观音质评价
1.
This paper studies briefly a distance measure for objective quality evaluation of speech communication channels using instantaneous and dynamic spectral features.
主要讨论了一种使用语音频谱动态特性的倒谱距离测量对通信系统或通信设备进行客观音质评价方法。
5)  Objective Estimation of Speech Quality
音质客观评价
6)  objective quality assessment of speech
语音客观质量评估
1.
We firstly review the monaural speech separation method based on objective quality assessment of speech (OQAS) and computational auditory scene analysis(CASA).
在回顾了基于语音客观质量评估和计算听觉场景分析的单声道混合语音分离方法的基础上,针对该方法所采用的ITU-TP。
补充资料:室内音质评价
      室内音质是指房间中传声的质量。音质评价是从人们主观听觉感受出发的各种描述。例如对语言用语言清晰度百分率,对音乐则用音乐的欣赏价值来评定。评价具有某种主观性,因而在量的描述上必然有相当大的幅度变化,对音乐尤其如此。所以音质评价的标准只是反映某种统计方式的结果。
  
  在声学工程中,有必要弄清主观音质评价的实际意义,并根据物理量规定出相应的客观标准,以作为判断房间音质的依据。室内音质评价的物理参量主要有下列五个:
  
  ① 混响时间。即声音在室内交混回响的时间。短混响时间是保证语言清晰度的重要条件,但会降低声音的强度。对音乐来说,会使人感到音质干涩,因而希望有较长的混响时间以增加活跃的声学效果,使音乐丰满动听。图1表明最佳混响时间与不同使用要求和大厅容积的经验关系。这是对已建大厅作了大量实验,从主观评价和混响时间测量互相对照而得出的结果。图上的斜线是按500和1 000赫的平均值绘制的。对低频则允许略长,如125赫,可比图1给出的值最多增加到1.5倍。对高频则最好保持中频的值。
  
  
  ② 扩散程度。混响时间不是唯一的音质评价标准。在大小相近、混响时间也差不多的房间里,音质可能不同。这在很大程度上是由于室内混响声的空间取向不同。如混响声以近乎相同分量从各方向到达听者耳中,则表示扩散程度最高。这是长混响时间和许多不规则界面作用的综合结果。在实际房间中,几乎没有充分扩散的声场,而且即使有,对音质来说也未必理想,因为它削弱了对声源的方位感。在短混响时间的矩形小房间(如录声室)中,扩散程度往往较低。这不仅会使音质不佳,而且对传声器位置的选择也会带来一定的困难,因此,在设计时就应注意。
  
  扩散程度是反映室内一点从各方向传来声能是否均匀的度量。但它和听者主观评价之间的关系还未完全确立,迄今还处在定性分析阶段。
  
  ③ 反射声的干扰度。语言和音乐都是带有脉冲性质的声音,因此要用室内脉冲响应来分析反射声序列对清晰度的干扰。图2是一个延迟语言信号对听者引起干扰的百分率例子。曲线上所标的是反射声相对于直达声的声级差(分贝),纵坐标为听者感到有回声干扰的人数百分率,横坐标为回声的延迟时间。这是在混响时间为0.8秒的一间试听室内,每秒5.3个音节的速率讲话时所得的实验结果。在试听室的混响时间不同、讲话速率不同的条件下,直达声和反射声有相同声级时的回声临界(取50%干扰率)延迟时间如表所列。  ④ 早期反射声能与混响声能之比。在室内脉冲响应的反射声序列中,开始一段时间内到达的所有反射声对房间的主观音质评价均起有利作用(如提高响度和清晰度)。这种反射声称为早期有利反射声。它的有效程度取决于所有早期反射声能E与整个混响声能E 之比,这个声能之比称为明晰度D。早期反射声一般取到 50毫秒。明晰度D与主观语言音节清晰度的关系见图3。图中曲线是用 20毫秒宽的脉冲声,并对主要语言传输频率范围的结果取其平均值得到的。许多学者认为计算早期有利反射声的时间界限不是一个临界值,而且各个反射声也不是等效的。时间界限可计算到95毫秒。
  
  
  对音乐来说,情况要复杂得多。不仅要考虑到早期反射声能所占的比重,还要考虑它们传来的方向。因为80毫秒之内的侧向和非侧向早期反射声能比,会影响到听音的立体感(又称空旷感)。即适当加强侧向早期反射声,能使声源的空间距离展宽;如果超过一定比值,又会造成虚声源,引起移位错觉的不良后果。
  
  ⑤ 信号噪声比。为了保证室内有安静的理想听音环境,一般允许的噪声级为35~40分贝(无人占用时)。至于清晰度条件的决定,还要考虑信号和噪声的相对关系。信号噪声比增大,语言清晰度也随之增大(图4)。一般说来,语言信号只要比环境噪声(宽带而无突出的纯音成分)高出10~15分贝就足够了。
  
  
  

参考书目
   王季卿等:《实用会场扩声》,科学出版社,北京,1980。
   F.A.White,Our Acoustic Environment, John Wiley& Sons,New York,1975.
  

说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条