言语可懂度简易客观评价方法对比_刘浩成.pdf
《言语可懂度简易客观评价方法对比_刘浩成.pdf》由会员分享,可在线阅读,更多相关《言语可懂度简易客观评价方法对比_刘浩成.pdf(5页珍藏版)》请在咨信网上搜索。
1、2022年第46卷第12期9Acoustics FoundatioN声 学 基 础声 学 基 础文献引用格式:刘浩成,祝培生,宋嘉炜,等.言语可懂度简易客观评价方法对比 J.电声技术,2022,46(12):9-13.LIU H C,ZHU P S,SONG J W.Comparison on simple objective evaluation methods of speech intelligibilityJ.Audio Engineering,2022,46(12):9-13.中图分类号:TU112.4 文献标识码:A DOI:10.16311/j.audioe.2022.12.00
2、3言语可懂度简易客观评价方法对比刘浩成,祝培生,宋嘉炜,刘曦东(大连理工大学 建筑与艺术学院,辽宁 大连 116024)摘要:言语可懂度是厅堂音质评价的重要指标。对言语可懂度的客观评价,除国际标准推荐的语音传输指数(SpeechTransmissionIndex,STI)外,在工程实践中,声学设计者常使用一些易于测量和掌握的简易方法,如明晰度 C50、清晰度 D50、有益有害声能比 U50以及语音干扰级等。结合大量教室实测数据,通过建立简易方法与 STI 的线性关系,系统地对比简易方法相对于 STI 的偏差程度,结果表明:各简易方法在不同声学条件下与 STI 的偏差程度存在较大差异,在某些条件
3、下可与 STI媲美;C50,D50在混响时间较长时与 STI 偏差程度较小,线性回归结果的估计标准误差(StandardErrorofEstimate,Se)均小于 STI 的 1 个 JND;U50在不同混响和信噪比条件下与 STI 的偏差程度均较小,线性回归得到的 Se 最大仅在 STI 的 1 个JND 左右;语音干扰级在混响时间较短时与 STI 偏差程度相对较小,但 Se 仍接近 2 个 JND。相关结果可为简易方法的使用者提供参考。关键词:言语可懂度;语音传输指数;声能比参量;语音干扰级Comparison on Simple Objective Evaluation Methods
4、 of Speech IntelligibilityLIU Haocheng,ZHU Peisheng,SONG Jiawei,LIU Xidong(School of Architecture and Fine Art,Dalian University of Technology,Dalian 116024,China)Abstract:Speech intelligibility is an important indicator for the evaluation of the sound quality of the hall.For the objective evaluatio
5、n of speech intelligibility,in addition to the Speech Transmission Index(STI)recommended by international standards,in engineering practice,acoustic designers often use some simple methods that are easy to measure and master,such as C50,D50,U50,speech interference level,etc.This paper combines a lar
6、ge number of classroom measurements and systematically compares the deviation of simple methods relative to STI by establishing a linear relationship between simple methods and STI.The results show that,the degree of deviation from STI under different acoustic conditions varies considerably among th
7、e simplified methods and is comparable to STI under certain conditions,C50 and D50 deviate less from STI at longer reverberation times,and the Standard Error of Estimate(Se)of the linear regression results are less than 1 JND of STI,the deviation of U50 from STI for different reverberation and signa
8、l-to-noise ratios is small,and the maximum Se of the linear regression results is only around 1 JND of STI,speech interference level deviates relatively little from STI at shorter reverberation times,but Se is still close to 2 JND.The results can provide references for users of the simple methods.Ke
9、ywords:speech intelligibility;speech transmission index;sound energy ratio parameters;speech interference level0 引 言言语可懂度是评价厅堂语音传输质量的重要指标,其评价方法可分为主观评价和客观评价两种。客观评价方法中,语音传输指数(Speech Transmission Index,STI)1是 国 际 电 工 委 员 会基金项目:国家自然科学基金项目(52278092,51878110,11774266,51778100)。作者简介:刘浩成(1996),男,硕士研究生,研究方向为
10、建筑声学。通信作者:祝培生(1969),男,教授,博士生导师,研究方向为建筑声学。E-mail:。2022年第46卷第12期10声 学 基 础声 学 基 础coustics FoundationA(International Electrotechnical Commission,IEC)推荐的标准方法,其能综合考虑混响时间和信噪比的影响,并与言语可懂度的主观感受直接对应,具有预测精度高、应用条件广泛等优势2。但 STI方法的模型相对复杂,测量时需具有较好的技术基础,因此其应用与推广还不十分理想。目前在工程实践中,设计人员仍较常使用一些模型简单、易于测量与掌握的简易方法,如明晰度(Clarit
11、y,C50)3、清晰度(Definition,D50)4、有益有害声能比(Useful-to-detrimental sound ratios,U50)5和语音干扰级(Speech Interference Level,SIL)6。但这些简易方法大多无法综合考虑噪声和房间声学条件对言语可懂度的影响,因此相对于较为准确的STI 方法,这些简易方法在实际应用中会存在怎样的偏差,以及相应的适用条件是什么,都是在使用这些简易方法之前应该考虑的问题。BRADLEY 等7在无噪声的三种混响条件下建立了 C50与 STI 的线性关系,结果表明,C50与 STI的线性回归结果较好,二者拟合程度较高,但其实验基
12、于扩散声场而非实际声场。SATO 等8探讨了C50,D50与 STI 的关系,结果表明 C50,D50可成为STI 的简易替代,但实验仅考虑了混响时间,未考虑噪声因素的影响。CHOI9通过测量大学教室,建立了 U50与 STI 的对应关系,结果表明 U50,STI 均是较为准确的言语可懂度客观评价参量,但实测信噪比仅限于 11.3 18.7 dBA。总的来说,现有研究选用的声学条件并不能很好地反映实际厅堂中的情况,并且考察的简易方法也较为分散,导致研究结果间的可比性较差。因此,有必要结合大量、具有代表性的建筑声学条件,对简易方法与 STI 的关系进行系统性的对比研究。本文依据大量教室的实测数据
13、,通过建立 STI与声能比参量(C50,D50,U50)和 SIL 的对应关系,探讨了这些简易方法用于言语可懂度评价时相对于 STI 的偏差程度,并结合不同混响、信噪比条件明确了各简易方法的适用条件。研究结果可为言语可懂度简易客观评价方法的使用者提供一定参考。1 实验方法由于各简易方法对于房间声学条件的考虑并不相同,其中 C50,D50无法考虑噪声对言语可懂度的影响,SIL 无法考虑混响对言语可懂度的影响,为全面、系统地对比不同听音条件下的简易方法,本文选择了具有代表性的三个混响时间范围和三个信噪比条件。1.1 实验设置本文对 8 个教室空场条件的声环境进行了实测,分别编号为 C1C8、L1L
14、4。其中,L1L4为 C5C8 四个教室经过室内声学改造后的编号。因此,本研究共获取了 12 个房间的实际声学条件,所有教室的中频混响时间(Reverberation Time,RT)范围为 0.5 2.6 s。其中,C1C4 的 RT 范围为 2.0 2.6 s,代表了教室中较不理想的混响条件;C5C8 的 RT 范围为 1.3 1.5 s,代表了超出国家标准的10、当前教室中较多存在的混响条件;L1L4 的 RT 范围为 0.5 0.7 s,代表了满足国家标准的教室混响条件。为获得从非常差到非常好的听音条件,对每个房间的所有测点均设置了 3 种信噪比(Signal-to-Noise Rat
15、io,SNR)(0 dBA,10 dBA,20 dBA)。其中,0 dBA 代表听音条件非常差的 SNR 条件,10 dBA代表能够听清楚的最低 SNR 条件,20 dBA 为非常理想、清楚的 SNR 条件。STI 测量按照 IEC 60268-16 标准推荐的间接法进行。信号声源(B&K Echo Speech Source 4720)依次播放对数扫频信号和操作语音信号。干扰噪声源(GENELEC 8020B)播放经过汉语语言频谱调整的粉红噪声。其中,操作语音信号声级已在消声室内距离声源正前方 1 m 处设定声压级为 60 dBA。简易方法测量使用声源 B&K 4292L 播放对数扫频信号测
16、量得到脉冲响应,通过脉冲响应及其他相关信息5-6计算得到了C50,D50,U50和SIL值。测量前,对整个测量系统的频率响应进行均衡,并进行了回路校验,确保其为线性时不变系统,无谐波产生。1.2 测量结果当前研究与设计应用中,对声能比参量与 SIL的定义存在多种不同频带范围的计算方式8,9,11,其中,对于 SIL 还分别存在 IEC1与国际标准化组 织(International Organization for Standardization,ISO)6描述的两种频带范围的计算值。为选择更为适当的频带范围,使用自然噪声条件下测得的STI 值分别与不同频带范围的简易客观评价方法进行了线性回归
17、分析,发现 C50(0.5 1 kHz)、D502022年第46卷第12期11Acoustics FoundatioN声 学 基 础声 学 基 础(0.5 4 kHz)、U50(0.5 4 kHz)、SIL(0.5 2 kHz)与 STI 的相关性相对较高。因此,采用上述频带范围计算得到的参量值作为本文中各简易方法的定义方式。最终测量所得的STI值在0.1360.835 范围内,C50范围为-10.1 11.3 dB,D50范围为0.134 0.940,U50范围为-14.4 11.7 dB,SIL 范围为-1.9 23.6 dB。2 实验结果本节通过建立各简易方法与 STI 的线性回归模型,
18、系统地对比了各简易方法相对于 STI 的偏差程度。回归得到的判定系数 R2和估计标准误差(Standard Error of Estimate,Se)分别反映了拟合优度以及使用简易方法预测 STI 时的偏差程度。2.1 STI 与 C50,D50的关系由于 C50和 D50通过早期声能和后期声能或总声能的比率来评价可懂度,这些参量反映的是声能分布,并没有考虑背景噪声的影响,因此本文首先分别在三个 SNR 条件下,对 STI 与 C50,D50进行了线性回归分析。结果表明:对应于 0 dBA、10 dBA、20 dBA 三个 SNR 条件,C50与 STI 回归得到的 R2分别为0.93,0.9
19、5,0.95,Se分别为0.023,0.029,0.032;D50与 STI 回归得到的 R2分别为 0.94,0.96,0.96,Se 分别为 0.021,0.027,0.030。由于 STI 的最小可觉差(Just Noticeable Difference,JND)约为0.037,因此 Se 均小于 STI 的 1 个 JND。可见,当考虑了所有混响条件时,在三个 SNR 条件下,C50和 D50与STI 回归得到的 R2均较高,偏差程度相对较小。进一步在三种 SNR 条件的基础上,区分三种混响条件,对 STI 与 C50,D50进行线性回归分析,相关结果如图 1 所示。当 RT 为 0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 言语 可懂度 简易 客观 评价 方法 对比 刘浩成
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。