T∕CTSA 0015-2023 虚拟数字人能力技术要求 第1部分:通用技术要求.pdf
《T∕CTSA 0015-2023 虚拟数字人能力技术要求 第1部分:通用技术要求.pdf》由会员分享,可在线阅读,更多相关《T∕CTSA 0015-2023 虚拟数字人能力技术要求 第1部分:通用技术要求.pdf(14页珍藏版)》请在咨信网上搜索。
1、ICSICS 03.080.0103.080.01A10A10团体标准T/T/C CTSATSA0 0015015-2023-2023虚拟数字人能力技术要求第 1 部分:通用技术要求Technical Requirements for Digital Human CapabilitiesPart 1:General Technical Requirements2023-03-31 发布2023-03-31 实施中关村中恒文化科技创新服务联盟发 布学兔兔 标准下载T/CTSA 0015-2023I目目次次前言.II1范围.12规范性引用文件.13术语和定义.13.1通用术语.13.2技术术语.2
2、3.3应用术语.44缩略语.45虚拟数字人分类.45.1概述.55.2按照图像资产分类.55.3按照互动形式分类.55.4按照应用模式分类.66虚拟数字人系统.67虚拟数字人资产.77.1概述.77.2图形图像资产.77.3动态数据资产.87.4系统技术资产.88虚拟数字人角色的能力.108.1概述.108.2形象呈现能力.108.3语音生成能力.108.4动作驱动能力.108.5交互表达能力.108.6内容供给能力.118.7整体表现能力.11学兔兔 标准下载T/CTSA 0015-2023II前前言言本文件按照 GB/T 1.12020标准化工作导则 第 1 部分:标准化文件的结构和起草规
3、则和GB/T 13016标准体系构建原则和要求的规定起草。T/CPRA 3104虚拟数字人能力技术要求分为 3 个部分:第 1 部分:通用技术要求;第 2 部分:非实时交互虚拟数字人的能力分级与评测;第 3 部分:实时交互虚拟数字人的能力分级与评测;本文件是 T/CPRA 3104 的第 1 部分。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由中关村中恒文化科技创新服务联盟和中国公共关系协会文化大数据产业委员会共同提出并归口。本文件起草单位:中央戏剧学院、快手科技有限公司、北京理工大学、中科院自动化所、北京蓝色光标数据科技股份有限公司、海信视像科技股份有限公
4、司、北京素鳞科技产业有限公司、广州玖的数码科技有限公司、广州龙联科技文化发展有限公司、伏羲云(北京)文化科技有限公司、北京玖扬博文文化发展有限公司、北京邮电大学、华邮数字文化技术研究院(厦门)有限公司、海南大学、中关村中恒文化科技融合创新中心、清研千讯(北京)科技有限公司、厦门理工学院影视与传播学院、厦门理工学院设计艺术学院、福建网龙计算机网络信息技术有限公司、上海东方怡动数字科技有限公司、数字栩生(北京)科技有限公司。本文件主要起草人:宋震、徐梦露、郑屹、刘文超、翁冬冬、包仪华、刘杰、刘复昌、潘志庚、郭晓喆、杨善松、刘德建、吴立素、高楠、蒋耀琳、付爱国、葛岩、许经捷、庞博、闫喆、朴经纬、苏彦
5、聪、李建勋、张勇、谢生文、黄梦醒、刘兵、高凯、亓峰、何雪萍、王竞然、薛晓鹏、尹晖、陈磊、崔义娜、代旭、高歌、陈洪、周萍、何乐、陈皓月。学兔兔 标准下载T/CTSA 0015-20231虚拟数字人能力技术要求虚拟数字人能力技术要求第第 1 1 部分部分:通用技术要求通用技术要求1 1范围范围本文件规定了虚拟数字人基础术语、虚拟数字人分类、虚拟数字人系统、虚拟数字人资产和虚拟数字人角色的能力等通用技术要求。本文件适用于虚拟数字人系统建设、虚拟数字人资产生产,以及虚拟数字人运营。2 2规范性引用文件规范性引用文件下列文件中内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅
6、该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包含所有的修改单)适用于本文件。ITU-T F.748.14 Requirements and evaluation methods of non-interactive 2D real-person digitalhuman application systemITU-T F.748.15 Framework and metrics for digital human application system3 3术语和定义术语和定义下列术语和定义适用于本文件。3.13.1 通用术语通用术语3.1.13.1.1虚拟数字人虚拟数字人di
7、gital human是指集成了计算机图形学、计算机视觉、智能语音、自然语言处理技术的计算机应用程序,可用于数字内容生成和人机交互,帮助提高内容制作效率和用户体验。来源:ITU-T F.748.15,3.2.1虚拟数字人一般由虚拟数字人系统、虚拟数字人资产、虚拟数字人角色构成。3.1.23.1.2虚拟数字人系统虚拟数字人系统digital human system是指利用人机界面、通信设施和数据管理系统等资源提供的服务来实现虚拟数字人能力的应用程序。3.1.33.1.3虚拟数字人资产虚拟数字人资产digitaldigital humanhuman assetsassets是指虚拟数字人开发过程
8、中所涉及到的数字资源,通常以可存储的数据、文本等信息为载体和表现形式,能够持续用于支持虚拟数字人应用系统运行并能够带来一定的经济效益,主要包括但不限于图形图像资产、动态数据资产、系统技术资产。学兔兔 标准下载T/CTSA 0015-202323.1.43.1.4虚拟数字人角色虚拟数字人角色digital human character是指基于虚拟数字人系统,以虚拟数字人资产为支撑、以人形外貌为表征、以人机交互为主要方式、具有多重人类特征的数字孪生产物,其对外可呈现出相应的服务能力,主要表现为形象呈现、语音生成、动作驱动、交互表达、内容表现、整体表现等维度的能力。通常虚拟数字人角色狭义地被称之为
9、虚拟数字人。3.23.2 技术术语技术术语3.2.13.2.1纹理纹理texture是指经过正射纠正和统一匀光处理,用于表示物体色调、饱和度、明度等特征来反应模型表面纹理和色泽特征的贴图影像。来源:CH/T 9015-2012,3.103.2.23.2.2材质材质material是指赋予模型表面色彩、纹理、光滑度、透明度、反射率、折射率、发光度等可视属性的过程,主要用来表现物体对光的反射、折射等交互性质。来源:DB22/T 2019,2.63.2.33.2.3渲染渲染rendering是指对一个虚拟场景进行处理,得到符合人类知觉(视觉、听觉、触觉等)输出的过程。本文件中特指经由虚拟数字人模型数
10、据生成一张或多张二维图像的技术,可具体分为实时渲染技术和离线渲染技术。来源:GB/T 38247-2019,2.2.413.2.43.2.4骨骼节点骨骼节点bone nodes是指为了实现虚拟数字人表情、动作变化所创建的一系列与虚拟数字人模型相互关联的可控节点。3.2.53.2.5蒙皮蒙皮skinning是指把虚拟数字人模型上的三维顶点关联到骨骼节点上的技术,使虚拟数字人模型可以通过骨骼运动带动整体模型的形变与运动。3.2.63.2.6绑定绑定rigging是指通过给模版参数提供参数值,从模版产生模型元素的过程。本文件中特指为模型添加骨骼和控制器的制作过程,使模型物体有层次地被相关联的骨骼控制
11、,最终应用于虚拟数字人动画环节的制作。来源:SJ/T 11290-2003,2.213.2.73.2.7模型模型model学兔兔 标准下载T/CTSA 0015-20233是指对客观现实某些方面的抽象。本文件中特指利用三维建模和重建技术,仿照实际人体外形或设计图样(不局限于平面与立体)生成的三维数据集合,通常应用于虚拟数字人呈现。来源:GB/T 17694-2009,B.3143.2.83.2.8模型数据模型数据model data是指具备三维网格拓扑结构、表面具有纹理蒙皮的物体模型,通常包括建筑、树木、小品等,一般是由 3DMax、Auto CAD 等可视化三维建模工具,工程人员通过手工绘制
12、形成,或由三维测量车等自动创建形成的三维模型。为实体物的三维模型拓扑文件,包括三种类型,分别为要素模型、网格模型、场景模型。本文件中特指针对虚拟数字人的模型数据。来源:DB42/T 1506-2019,3.23.2.93.2.9三维建模和重建三维建模和重建3D modeling and reconstruction是指基于传感器对真实场景进行测量并构建其三维模型。来源:GB/T 41864-2022,3.7.153.2.103.2.10图像分辨率图像分辨率 image resolution是指图像单位尺寸中包含的像素点数,用于描述图像精细程度。注 1:对于数字图像的分辨率,通常由垂直方向和水平
13、方向单位距离的像素个数确定。来源:GB/T 41864-2022,3.1.113.2.113.2.11交互交互interaction是指一种行为,它由一些特定背景下为实现特定目的的对象之间交换的消息组成。本文件中特指用户与虚拟数字人进行交流互动的行为。来源:GB/T 41864-2022,2.693.2.123.2.12文本驱动文本驱动text driven是指以文本作为输入,通过处理生成虚拟数字人表情、动作、语音或视频的驱动方式。3.2.133.2.13音频驱动音频驱动audio driven是指以声音作为输入,通过处理生成虚拟数字人表情、动作或视频的驱动方式。3.2.143.2.14视频驱
14、动视频驱动video driven是指以图像或视频作为输入,通过处理生成虚拟数字人表情、动作、语音或视频的驱动方式。3.2.153.2.15动作捕捉驱动动作捕捉驱动motion capture driven是指通过动作捕捉设备对真人的动作捕捉,实现对虚拟数字人表情及动作控制的驱动方式。3.2.163.2.16完备度完备度completeness degree描述虚拟数字人的模型组件、纹理贴图等构成要素是否能够充分支撑渲染需求,是否用分离的子模型完整表达了模型的重要组成部分。学兔兔 标准下载T/CTSA 0015-202343.2.173.2.17精细度精细度fineness degree描述虚
15、拟数字人模型中各视觉要素的粒度或精度是否能够充分满足渲染需求。3.2.183.2.18风格贴合度风格贴合度artistic style matching degree描述虚拟数字人实际表现的现实状态与其前期设定的预期状态相似程度。3.33.3 应用术语应用术语3.3.13.3.1数字人美术风格数字人美术风格digital human art style是指虚拟数字人渲染的美术风格,可根据与真人的相似程度可分为卡通、半写实、写实等 3个类别。3.3.23.3.2形象呈现能力形象呈现能力image presentation ability是指能够提供虚拟数字人视觉外观载体的能力。3.3.33.3.
16、3语音生成能力语音生成能力speech synthesis ability是指能够提供虚拟数字人语言表达载体的能力。3.3.43.3.4动作驱动能力动作驱动能力motion driven ability是指能够实现虚拟数字人从静态呈现转换为动态呈现的能力。3.3.53.3.5交互表达能力交互表达能力interactive expression ability是指能够基于信息获取、识别、处理、传达等行为与用户进行互动的能力。3.3.63.3.6内容供给能力内容供给能力content supply ability是指虚拟数字人能够实现知识表达的服务技能,具有用语言、面部表情和肢体动作等多模态信息进
17、行表达沟通的能力。3.3.73.3.7整体表现能力整体表现能力overall representation ability是指虚拟数字人形象、语音、驱动、同步、表达、感知互动等方面的综合能力。4 4缩略语缩略语下列缩略语适用于本文。2D:二维(Two-Dimensional)3D:三维(Three Dimension)AI:人工智能(Artificial Intelligence)5 5虚拟数字人分类虚拟数字人分类学兔兔 标准下载T/CTSA 0015-202355.15.1 概述概述虚拟数字人的分类方法包括但不限于从图像资产、互动形式、应用场景等 3 个维度进行划分。5.25.2 按照图像资
18、产分类按照图像资产分类图像资产可以按照空间渲染层次、美术风格进行分类。(1)按照图像资产空间渲染层次,虚拟数字人分为 2D 和 3D 虚拟数字人。2D 虚拟数字人是指所构建的虚拟数字人仅具有高度和宽度两个层次信息的平面形态,不包含深度信息;3D 虚拟数字人是指所构建的虚拟数字人兼具高度、宽度和深度三个层次信息的立体形态。(2)按照图像资产美术风格,虚拟数字人分为卡通虚拟数字人、半写实虚拟数字人和写实虚拟数字人。卡通虚拟数字人是指以夸张变形为主要特点,依据生产者的创造力和想象力,通过造型手段使虚拟数字人视觉特征更加鲜明,有意识地将虚拟数字人的脸型、五官形状与位置、躯干造型及比例等参数摆脱真人生理
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- TCTSA 0015-2023 虚拟数字人能力技术要求 第1部分:通用技术要求 CTSA 0015 2023 虚拟 数字 能力 技术 要求 部分 通用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【sujian****n2011】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【sujian****n2011】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。