DB35∕T 1979-2021 智慧家庭人工智能语音服务通用技术规范(福建省).pdf
《DB35∕T 1979-2021 智慧家庭人工智能语音服务通用技术规范(福建省).pdf》由会员分享,可在线阅读,更多相关《DB35∕T 1979-2021 智慧家庭人工智能语音服务通用技术规范(福建省).pdf(19页珍藏版)》请在咨信网上搜索。
1、ICS35.240.01CCSL77.935福建省地方标准DB35/T1979一2021智慧家庭人工智能语音服务通用技术规范Ge n e r a lt e c h n i c a ls p e c i f i c a t i o nf o ra r t i f i c i a li n t e l l i g e n c ev o i c es e r v i c eo fs m a r th o m e2021一06一21发布2021一09一21实施福建省市场监督管理局发布.9口口口口口口口口口口口口口口口口DB35/T1979一2021目次前言.H1范围.12规范性引用文件.13术语和定义
2、.14缩略语.25语音服务的组成及能力等级划分.36环境要求.37基本要求.48测试方法.10附录A(规范性)语音测试集录音质量要求.巧附录B(规范性)测试用设备要求.16DB35/T1979一2021士一口一Rl J本文件按照GB/T1.1一2020标准化工作导则第1部分:标准化文件的结构和起草规则的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由福建省工业和信息化厅提出并归口。本文件起草单位:中国移动通信集团福建有限公司、科大讯飞股份有限公司、中移(杭州)信息技术有限公司、福建福诺移动通信技术有限公司、中 国电信股份有限公司福建分公司、中国联合网
3、络通信有限公司福建省分公司、福建广电 网络集团、华为技术有限公司、福建星网锐捷通讯股份有限公司、新大陆通信科技股份有限公司、福建福日电子股份有限公司。本文件主要起草人:章金水、黄海辉、林海、俞晓梅、罗新喜、孙凯廷、马培培、罗红、程宝平、李栋、黄晓明、韦观明、屈彤、吴振文、沈绍昌、王献飞、杨韬。DB35/T1979一2021智慧家庭人工智语音服务通用技术规范范围本文件规定了智 慧家庭人工智能语音服务的组成及能力等级划分、环境要求、基本要求和测试方法。本文件适用于智 慧家庭人工智能语音服务的建设、测试和评价。2规范性引用文件下 列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注
4、日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB3096一2008声环境质量标准GB/T21023一2007中文语音识别系统通用技术规范GB/T21024一2007中文语音合成系统通用技术规范GB/T22239一2019信息安全技术网络安全等级保护基本要求GB/T36464.1一2020信息技术智能语音交互系统第1部分:通用规范GB/T36464.2一2018信息技术智能语音交互系统第2部分:智能家居3术语和定义GB/T21023一20C了、GB/T21024一2007、GB/T36464.1一2020、GB/T36464.2
5、一2018界定的以及下列术语和定义适用于瓜文件。3,1语音服务v o1c es e r y1c 6人机之间通过自然语言对话来获取信J自、的服务3,2语音采集v o1c ea c q日151t1o n通过传声器或麦克风阵列等拾音设备对语音进行采华。3,3语音识别s p e e c hr e c o g n1t1o n将人类的声音信号转化为文字或指令的过程。来源:GB/T21023一2007,3.13,4语义理解s e m a n t1cu n d e r s t a n d1n g使功能单元理解人说话的意图。来源:GB/T36464.1一2020,3.11DB35/T1979一20213.5语音
6、合成s p e e c hs y n t h e s15通过机械的、电子的方法合成人类语言的过程。来源:GB/T21024一2007,3.13.6端点检测v o1c ea c t1v1t yd e t e c t1o n一种用于分析、判断连续音频流中有效起始点和结束点的语音处理技术。来源:GB/T36464.1一2020,3.223.7智能语音终端a r t1f i。1a11n t e111g e n c ev o i。et e r m i n a l可接收用 户的语音,使得用 户可以获取在线音视频等内容,或可通过语音进行控制的设备。3.8噪声n o156语音采集过程中,采集到的由非有效语音信
7、源发出的,能干扰、影响对有效语音信号的理解或处理的声音信号。来源:GB/T36464.1一2020,3.273.9等效声级e q u1v a1e n tc o n t1n u o u SA一w e1g h t e d50日n dp r e s s u r e1e v e l在声场中的某个位置上,用某一段时间内能量平均的方法,将间歇暴露的几个不同噪声,用这样一个声级来表示该段时间的噪声大小。3.10平均意见得分m e a no p1n1o nSc。r e语音质量的一种主观度量。来源:GB/T36464.2一2018,3.263.11语音唤醒s p e e c i.,4a。u p:v o1c et
8、 r1g g e r处于音频流监听状态的语音交互系统,在检测到特定的特征或事件出现后,切换到命令词识别、连续语音识别等其他处理状态的过程。来源:GB/T36464.2一2018,3.133.12媒资m e d1aa SSe t s媒体单位生产的文字、图片、音视频等数据。3.13媒资库m e d1ap o o l存储媒资的数据库。4缩略语下列缩略语适用于本文件。PCM:脉冲编码调制(Pu lSeCo d eMo d u l a t i o n)MOS:平均意见得分(Me a nOpi n i o nSCo r e)DB35/T1979一20215语音服务的组成及能力等级划分5.1语音服务的组成由
9、语音采集与识别、语义理解、语音合成与播放、语音技能四个部分组成。5.2语音服务能力等级划分语音服务能力根据成熟度划分为五个等级,见表1。表1语音服务能力等级语音服务能力等级定义语音技能语义深度理解与初能互动主体语音采集与识别语义理解语音合成与播放上下文及多场景语义理解与 智能终端智能翻译控制多级互动语义理解与语音互动语音深度识别与自然合成语音识别与机器合成语音采集与播放端点检测语义理解白然合成(多语种、多发音人)应用唤醒、栏日唤起、内容搜索语音识别机器合成语音采集语音播放智能语音终端主要在家庭环境下仲用,在表2所示自然环境条件下应正常工作。畏2自然环境要求才匕对,显度,00f o一900f o
10、无凝结_一匕大气压力KPa86?1066.2网络环境智能语音终端或与之相连的智能设备应支持无线或有线网络接入互联网,网给挂入速度应不低于128k b i t/s。63噪声环境智能语音终端主要在家庭环境下使用,家庭噪声环境具体要求按照GB3096一2008第4章中O、1、2类声环境功能区的规定执行。DB35/T1979一20217基本要求7.1语音采集与识别7.1.1语音采集人工智能语音服务使用智能语音终端进行语音采集,应能通过传声器或麦克风阵列等具备语音采集能力的拾音设备对语音、连续语音进行单声道或多声道的采集。语音采集应满足以下要求:a)支持8k HZ或16k HZ采样率,16b i t及以
11、上的采样精度;b)音频文件编码支持PCM或Op u S或Sp e e x格式;C)对于连续性音频,支持305或605为时间单位进行切片分割。注:Op u s是有损音频的一种编码格式;Sp e e x是一套针对语音音频的压缩格式。7.1.2端点检测人工智能语音服务在进行语音采集时,应对采集的音频进行端点检测,以区分用户说话的自然停顿和主观停止。7.1.3语音识别应满足以下要求:a)支持家庭场景下关键词语音识别能力,如影视、音乐、医疗、教育等;b)支持简单中英文混合识别;C)支持数字、电话号码;d)支持普通话、带有福建口音的普通话;e)宜支持福建省内主流方言,如闽南语、客家语;f)语音识别句识别率
12、应满足表3要求。表3语音识别句识别率要求声环境功能区类别环境噪声等效声级d B(A)昼回30,夜间40亘!司55,夜!日巧昼间60,夜:司50句识别率%妻90妻85妻80类类类n钊119自句识别率计算方法按公式(1)。一100一” ”一” Xr1SS一一YPs一一句识别率,单位为百分数 (0f o);一一智能语音终端语音交互系统正确识别的句数;一一标注总句数。中式Psl孤此DB35/T1979一20217,2语义理解应满足以下要求:a)支持简称、别名、代码、数字的理解;b)具有用户表达存在错字、缺字、模糊时的容错理解能力;c)支持多轮、全双工对话的人机交互方式;d)语义理解正确率应满足表4要求
13、。表4语义理解等级表语义理解等级场民翔与氏语义理解止确率O类1类影视,电视直播,节日回看音乐,医疗,购物,教育)90妻85语义理解正确率计算方法按公式(2)。、l了9自Z才、气.RSS丛xIO00h式中:只、一一语义理解正确率,单位为百分数(0 / 0 );瓜、一一操作意图及语义要素均被正确判断的次数;N一一用 户输入被正确识别出文本信息的总次数。7,3语音播放与合成7.3.1语音播放具备声音外放功沙钧智能语音终端,昼间播放的语音提醒以及其它音频,外放声音应不低于60d B。7.3.2语音合成应满足以下要求:a)支持在线或离线方式合成近似人类r一i语音,b)支持普通话和英语,宜支持福建省囚主流
14、方一言,如闽南语、客家语;C)支持中英文数字等各种混合音,宜支持多音色仁成和个性化合成;d)MOS应大于或等于4,MOS量化分值见表5。表5MOS量化分值分值主观测听效果非常接近播音员真人发声,达到以假乱真的程度,总体听感很好,犷拿晰、流畅。发音清晰、可懂,总体听感好、流畅,听测人愿意接受(半小时左右不觉疲劳),没有明显韵律错误。基本可以听懂,但在语气节奏处理上问题较多,音节之间拼接不流畅感较重,听测人不太愿意接受,有明显的疲劳感。语音吐字不清晰,字词之间有较为严重的顿挫感,体验性不好,但不影响正常理解。5DB35/T1979一2021表5MOS量化分值(续)分值主观测听效果发音不清晰,机器音
15、质,听不懂,只能表达断续、个别的语音信 息,猜测语意都很困难,不能接受。注:参考GB/T36464.1一2020中A.8.3的表A.1,结合家庭环境要求,对主观测听效果作更详细描述。7,4语音唤醒7.4.1夜间唤醒具备语音唤醒功能声环境功能区类别O类的智能语音终端在夜间的唤醒率应满足表6要求。表6夜间不同噪声环境下的唤醒率要求夜间环境噪声等效声级发声大小d B(A)d B554O妻5560唤醒率要求1类45)60652类5O妻65不作要求3m优于95%不作要求l m优于95%3m优于90%s m优于85%不作要求3m优于85%夜间唤醒率计算方法扭公式(3)。飞、JZOOZ妞火.R一粉X,00%
16、一一夜间唤醒率,单位为百分数(夕:一一成功唤醒次数;一一语音唤醒操作次数。中式瓜孤瓜7.4.2昼间唤醒具备语音唤醒功能声环境功能区类别的智能语音终端在昼间的唤醒率应满足表7要求。表7昼间不同噪声环境下的唤醒率要求昼间环境噪声等效声级发声大小d B(A)d B655O妻65唤醒率要求O类不作要求3m优于90%DB35/T1979一2021声环境功能区类别表7昼间不同噪声环境下的唤醒率要求(续)昼间环境噪声等效声级发声大小d B(A)d B70唤醒率要求1类55妻70752类6O)75不作要求l m优于90%3m优于85%s m优于80%不作要求3m优于80%昼间唤醒率计算方法按公式(4)。、l了
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DB35T 1979-2021 智慧家庭人工智能语音服务通用技术规范福建省 DB35 1979 2021 智慧 家庭 人工智能 语音 服务 通用 技术规范 福建省
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【曲****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【曲****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。