2022中国虚拟数字人商业应用前景展望研究报告.pdf
《2022中国虚拟数字人商业应用前景展望研究报告.pdf》由会员分享,可在线阅读,更多相关《2022中国虚拟数字人商业应用前景展望研究报告.pdf(39页珍藏版)》请在咨信网上搜索。
1、2022中国虚拟数字人商业应用前景展望研究报告亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)2目录CONTENTS虚拟数字人行业综述虚拟数字人商业应用分析虚拟数字人现状及产业链分析虚拟数字人制作技术分析亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(21482
2、3)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)虚拟数字人行业综述亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)虚拟数字人打破物理空间限制,提供沉浸感、参与感和互动感u 虚拟数字人是通过建模、动作捕捉或 AI 等科技手段,制作出具有外貌特征和行为模式的虚拟形象,并通过显示设
3、备呈现出来。虚拟数字人创造的价值主要是打破物理的空间限制,提供了更多沉浸感、参与感和互动感;u 从概念上来说,数字人、虚拟人、虚拟数字人三者概念存在细微差别。数字人的范畴包含虚拟人,虚拟人的范畴包含虚拟数字人。数字人强调角色存在于数字世界,虚拟人的身份是虚构的且现实世界中不存在,虚拟数字人强调虚拟身份和数字化制作手段。来源:CG世界、智东西、中国人工智能产业发展联盟、亿欧智库根据公开资料整理亿欧智库:数字人、虚拟人和虚拟数字人三者关系亿欧智库:数字人、虚拟人、虚拟数字人概念辨析数字人虚拟人虚拟数字人强调其存在于数字世界,数字人的身份设定可以是按照现实世界中的人物进行设定,外观也可以完全一致;按
4、照真人还原制作的数字人也可以称为数字孪生人物的身份是虚构的,在现实世界中不存在;虚拟人没有现实世界中的身体,它是通过计算机图形学技术进行虚拟制作的,通过显示设备呈现出来;具备人类的外观和行为模式,虚拟人具有人类身体的外观形体结构数字人虚拟人虚拟数字人虚拟数字人指存在于非物理世界中,由计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等计算机手段创造及使用的产物;其具有人类的多重特征,如外表、行为、感知互动等亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(21482
5、3)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)高度拟人化的外表、行为、感知交互能力是虚拟数字人典型特征5u 虚拟数字人能否提供足够自然逼真的相处体验是检验虚拟数字人能否在各个应用场景中取代真人、完成语音交互升级的重要标准。亿欧智库认为,虚拟数字人应具有外表、行为与感知交互三大典型特征。来源:量子位、CG世界、2020年数字虚拟人发展白皮书、亿欧智库根据公开资料整理亿欧智库:虚拟数字人三大典型特征亿欧智库:当前国内代表性虚拟数字人010203外表行为感知交互面部长相和整体形象;拥有人的外观,具有特定的相貌、性别和性格等人物特征;会受到数字虚拟
6、人类别、制作细节、渲染水平、设计审美等影响面部表情、形体表达、语音表述等;虚拟数字人拥有人的行为,具有用语言、面部表情和肢体动作表达的能力;会受到驱动方式、驱动模型类别、训练数据、驱动模型精度等影响与现实世界的交互水平;虚拟数字人拥有人的思想,具有识别外界环境、并能与人交流互动的能力;会受到语音识别能力、自然语言理解及处理水平、知识图谱、预先设置知识库等影响百信银行:AIYA创壹科技:柳夜熙上海禾念:洛天依央视网:小C亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(
7、214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)交互方式和产业应用是虚拟数字人两大常见分类标准6u 虚拟数字人行业多种分类标准并存,交互方式和产业应用是两大常见分类标准;u 交互方式的维度,虚拟数字人可分为两大类:交互型虚拟数字人和非交互型虚拟数字人。而其中,交互型虚拟数字人又包括智能驱动型、真人驱动型两种;u 产业应用的维度,虚拟数字人分为三大类:虚拟偶像、虚拟主播、虚拟员工。亿欧智库:虚拟数字人按产业应用分类来源:中国人工智能产业发展联盟总体组、中关村数智人工智能产业联盟数字人工作委员会、中国传媒大学、亿欧智库根据公开资料整理亿
8、欧智库:虚拟数字人按交互方式分类交互型虚拟数字人真人驱动型虚拟数字人智能驱动型虚拟数字人非交互型虚拟数字人非交互型虚拟数字人系统依据目标文本生成对应的人物语音及动画,并合成音视频呈现给用户通过智能系统自动读取并解析识别外界输入信息,根据解析结果决策数字人后续的输出文本,然后驱动人物模型生成相应的语音与动作来使数字 人跟用户互动真人根据视频监控系统传来的用户视频,与用户实时语音,同时通过动作捕捉采集系统将真人的表情、动作呈现在虚拟数字人形象上定义运营方式主要代表虚拟偶像虚拟主播虚拟员工虚拟世界的主持人,在专业赛道上包括各大媒体的虚拟主持人、虚拟记者;而在视频平台上活跃的虚拟UP主们则由个人或企业
9、运营,数量庞大以歌手、演员、模特、网红等“艺人”身份出现,拥有鲜明的个性、才艺设定,活跃于各大社交平台、视频平台、综艺节目等,通过积累流量人气去获得更多的“工作”的虚拟数字人由企业推出,作为企业的数字员工,对外展示企业的产品、服务、文化。一类多作为智能客服出现,另一类则开始以偶像、红人方式在社交、短视频平台上独立吸粉不同形式交替出现,专业赛道以新闻播报为主要方式,短视频平台以直播带货为主与真实艺人类似,通过歌曲、硬照、短剧等方式进行人设运营企业虚拟品牌官、形象代言人、智能客服等苏小妹、柳夜熙、翎Ling、梅涩甜等湖南卫视主持人“小漾”、助农带货主播青小福等、人民日报果果、央视小C卡奥斯平台用户
10、体验官“爱卡”、万科集团虚拟收债人“崔筱盼”、百信银行虚拟品牌官“AIYA”等亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)虚拟数字人行业历经迭代发展,当前正处于集中成长期7u 虚拟数字人自 20 世纪 80 年代开始发展,当时技术以手绘为主;随后,传统手绘逐渐被 CG、动作捕捉等技术取代,且深度学习算法得到突破,虚拟人的制作过程得以简化,并朝着智能化、便
11、捷化、精细化、多样化的方向演进;u 从制作及交互两大环节来看,虚拟数字人的技术支撑主要有计算机图形学、语音合成技术、深度学习、类脑科学、生物科技、计算科学等聚合科技。在当前技术已不再是行业重要壁垒的条件下,亿欧智库认为,我国虚拟数字人产业或迈入集中成长期,应用场景逐渐拓宽,厂商将蜂拥而至。亿欧智库:虚拟数字人行业沿革2015年至今集中成长期21世纪初探索期1980-20世纪末萌芽期1982年日本动画超时空要塞女主角林明美被包装成演唱动画插曲的歌手,其专辑成功打入当时日本知名的音乐排行榜Oricon;1984年英国人George Stone创作的Max Headroom,拥有人类的外貌和表情动作
12、,曾参与电影和广告拍摄,其虚拟形象是由真人演员化妆和手绘实现;1994年,科乐美公司为游戏心跳回忆女主角藤崎诗织的设立官方后援会,发行官方季刊33期,而藤崎诗织也以虚拟偶像的名义独立发布了数张专辑;1997年,韩国Adamsoft公司发布了虚拟歌手Adam,他发行了两张专辑,参演了柠檬汽水广告2001年指环王中的角色咕噜由CG技术和动作捕捉技术产生,这些技术后续还在加勒比海盗、猩球崛起等电影制作中使用;2004年全球首例四位一体超人气偶像 E 欣欣诞生,同时拥有真人版偶像、3D/2D/Flash 动画版偶像、漫画版偶像和游戏版偶像,发布E 欣欣MTV 个人大碟;2007年日本Crypton F
13、uture Media以雅马哈的Vocaloid系列开发了以“初音未来”为外观形象的语音合成器软件。初音未来不断出单曲、代言、开演唱 会,成为世界上首个使用全息投影技术举办演唱会的虚拟偶像;2012年上海禾念以Vocaloid3语音合成引擎为基础,制作了全世界首款Vocaloid中文声库和虚拟形象“洛天依”2016年绊爱在多个平台发布视频,正式确立了虚拟主播Vtuber的概念和文化开端;2017年腾讯NExT Studios与AI Lab启动虚拟人Siren项目,目标是制作具备实时交流能力、实现高精度实时动作捕捉与渲染的虚拟人;2018年新华社与搜狗联合发布的“AI合成主播”,可在用户输入新闻
14、文本后,在屏幕展现虚拟人形象并进行新闻播报;2020年三星在CES国际消费电子展上展示其设计的数字虚拟人NEON;2021年中国首个Metahuman AYAYI迅速走红。其与娇兰、LV、BOSE、安慕希等大品牌达成合作并入职阿里巴巴游戏、动漫等产业衍生;技术以手绘为主,形象较为扁平单一;开始通过数字专辑、广告等方式变现电影产业技术进步推动;虚拟人的创作更加开放和多元;虚拟人的外形、动作、表情和声音与人类更加相似深度学习算法突破,向智能化、精细化、多样化发展,人工智能驱动的数字人开始崭露头角特点代表性案例来源:亿欧智库根据公开资料整理亿欧智库-单宏宇(214823)亿欧智库-单宏宇(21482
15、3)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)虚拟数字人制作技术分析亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)建模:外部扫描设备静态采集模型数据成本可控,应用范围广9u 虚
16、拟数字人制作流程主要为建模驱动渲染三个环节,其中建模生成是非常核心的一个步骤,也是较为困难的一环,奠定了未来使用的基础;u 人工建模是较为传统的建模方式,可以追溯到20世纪80年代,当时以手绘为主,如今人工建模主要指建模师使用MAYA、3DMax、Zbrush等相关软件来制作虚拟人,此种方式主要面临人工成本高的问题,且建模精度的提升需要相应人工、时间的大量投入;u 目前应用最广的是通过外部扫描设备静态采集模型数据建模的方式,数据的输入方式大致分为结构光扫描和相机阵列扫描。软件画图,建构出人物三视图运营团队协作,包括贴图、绑定、动画等环节使用三维建模软件建立基本三维模型132虚拟数字人人工建模步
17、骤人工制作周期较长,且成本非常高,源于该种建模方式的成本主要跟人力相关。高级别虚拟数字人的前期人工建模成本为几百万到千万元,且不包括后续的驱动、渲染等人工成本虚拟人越逼真、越精细,所需的建模时间与成本就会越高,预计一个高精度级别的虚拟人需要20人团队耗费约半年的时间来制作完成建模精度人工建模方式面临的挑战扫描技术类型扫描重建精度扫描时间技术特点技术应用领域结构光扫描重建技术0.1毫米级精度1秒以上或分钟级扫描时间较长,运动目标适应性差工业生产、检测相机阵列扫描重建技术毫秒级,高性能可达亚毫米级高速拍照扫描满足虚拟数字人扫描重建需求,周期短,节省人力游戏、电影、传媒等以IR和Ten24 为例的国
18、际企业已经将静态重建技术完全商业化,并服务于好莱坞大型影视虚拟数字人制作国内凌云光等公司制作的拍照式人体扫描系统也已经在电影、游戏、虚拟主播项目中成功应用,研发了高精度人体3D建模系统Human 3D+来源:亿欧智库根据公开资料整理亿欧智库:不同采集设备建模类型及参与厂商亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)建模:人工智能逐步渗透,将决定虚拟数字人
19、未来高度10扫描技术类型优缺点技术特点研究领域人体动态三维重建人体三维动态数据进行采集,实时渲染出真实的动态表演者模型采用摄像机阵列采集动态数据,可重建高低频几何、纹理、材质、三维运动信息计算机视觉、计算机图形学等领域光场成像可忽略材质,直接采集三维世界的光线,为人体三维重建提供了更加丰富的图像信息光场可以存储空间中光线的方向和角度,产出场景中所有表面的反射和阴影计算机摄像学等领域Microsoft、Google、Intel、Meta等公司都在积极展开相关研究,其中Microsoft的108摄像机MR Studio已经在全球各大洲均有建设;Google Relightable系统集合模型重建、
20、动作重建、光照重建的全部功能国内清华大学、华为、商汤科技等也展开了相关研究,并取得国际水平的同步进展。商汤科技专注于打造人工智能视觉引擎,动态光场重建的底层技术,计算机视觉技术亿欧智库:动态光场重建技术类型及参与厂商优势:大幅降低成本难点:关键技术突破人工智能生成与驱动的虚拟数字人所呈现的效果受到语音识别、自然语言处理、语音合成、语音驱动面部动画等技术的共同影响;人工智能建模还远不能完全取代纯人工建模与借助采集设备进行建模的结果,尤其是超写实、影视级别的虚拟数字人,人工智能技术还不能完美的生成与驱动,算法过于复杂;即使算法得到解决,自然交互是一大难题人工智能可以依据算法与机器学习来建模。机器能
21、够自动生成虚拟数字人的前提是要获取足够多的数据,对大量的照片/视频进行分析,提取到人的各种数据与信息,然后去模拟出没有提取到的那部分数据,这需要建立在机器对大量人脸照片/视频学习的基础之上,样本越多,算法生成出来的模型就越精准;建模的过程无需人工,仅后期修缮环节需要人工参与,进而将建模成本大幅降低亿欧智库:人工智能主导建模技术优势及难点来源:亿欧智库根据公开资料整理u 动态光场重建技术是未来重点发展的方向。通过动态光场重建技术建模可获得动态数据,高品质呈现光影效果。其主要数据扫描方式为人体动态三维重建及光场成像,其中涉及到计算机视觉、计算机图形学、计算机摄像学等前沿领域的研究,尚未得到普及。在
22、国内,清华大学、华为、商汤科技等已推进相关研究;u 人工智能技术逐渐被使用到虚拟数字人建模领域,随着算法与机器学习的成熟,未来制作虚拟数字人的门槛与成本将大幅降低。亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)驱动:智能合成与动作捕捉相辅相成11亿欧智库:虚拟数字人面部驱动流程来源:亿欧智库根据公开资料整理u 虚拟数字人驱动可拆分为面部驱动和肢体动作驱动。
23、面部驱动部分最重点的部分是嘴部动作驱动,通过大量文本数据映射及模型训练达到任意文本可驱动的模型。在嘴型以外,其他面部动作目前多采用随机策略,未来或在人工智能技术下实现自动化;u 肢体动作驱动主要通过动作捕捉生成,具体分为光学动捕、惯性动捕及计算机视觉动捕。映射语音嘴型视频(2D)嘴型动画(3D)模型训练得到输入任意文本都可以驱动嘴型的模型,通过模型智能合成其他面部动作目前多采用随机策略,或某脚本策略循环播放预先录制动画,文本与动作间的匹配主要通过手动配臵面部智能模型合成输入采集到的文本数据合成光学动捕 光学动捕的原理是首先跟踪、识别并命名目标身上各反光标记点,得出目标的基本骨架,再通过空间中多
24、个镜头对标记点位臵进行持续跟踪,完成对运动的记录;优势在于捕捉精度较高,缺陷是需通过相机的位臵角度建立三维空间坐标,对环境要求高,软硬件造价高昂惯性动捕 惯性动捕主要使用惯性传感器完成数据采集,通过处理建立运动的三维模型。传感器组成部分有集成加速度计、陀螺仪和磁力计等,可收集运动目标各部位数据;优势在于适应不同的环境,成本相对低,使用便捷,能弥补光学动作捕捉的缺点,缺陷是精度低、连续使用易产生累积误差计算机视觉动捕 基于计算机视觉的动捕技术使用多个不同角度的高速相机对目标进行拍摄,计算机视觉基于拍摄到的二维图像、三维形状特征还原各关节点运动信息;优势在于精确度高,成本相对低廉,近些年兴起后获得
25、青睐并在不同的应用端逐步推广;但计算量庞大、受外部环境影响大亿欧智库:主流动捕技术原理算法开发难度精度抗遮挡度环境要求硬件成本光学动捕惯性动捕计算机视觉动捕亿欧智库:主流动捕技术各指标对比(颜色越深代表程度越高)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)亿欧智库-单宏宇(214823)渲染:决定虚拟数字人最终呈现效果,技术驱动实时渲染逐渐普及12来源:亿欧智库根据公开资料整理u 渲染
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 中国 虚拟 数字 商业 应用 前景 展望 研究 报告
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。