6G知识体系构建:面向全域全场景的学术知识挖掘及其按需应用.pdf
《6G知识体系构建:面向全域全场景的学术知识挖掘及其按需应用.pdf》由会员分享,可在线阅读,更多相关《6G知识体系构建:面向全域全场景的学术知识挖掘及其按需应用.pdf(15页珍藏版)》请在咨信网上搜索。
1、2023 年 9 月 Journal on Communications September 2023 第 44 卷第 9 期 通 信 学 报 Vol.44 No.96G 知识体系构建:面向全域全场景的学术知识挖掘及其按需应用 沙子凡,承楠,惠一龙,岳文伟,付宇钏,孙瑞锦(西安电子科技大学空天地一体化综合业务网全国重点实验室,陕西 西安 710071)摘 要:当前 6G 相关概念并未统一,亟待一致性的认知和定义,学术和产业界对 6G 的发展全貌和相关领域研究进展缺少清晰认识。为此,构建了 6G 知识库及知识体系。首先,对现有 6G 学术文献进行自动化筛选和结构化存储;其次,在对文本数据进行标注
2、和规范化的基础上构建了 6G 知识库;再次,利用 6G 知识库实现了对 6G全领域的统计分析;利用自然语言处理、深度神经网络和潜在树模型等技术实现对 6G 知识的抽取和生成。最后,在大模型训练的基础上,面向多样化的服务需求实现按需的知识应用。关键词:6G;知识库;知识体系;知识树;按需服务 中图分类号:TN929.5 文献标志码:A DOI:10.11959/j.issn.1000436x.2023181 6G knowledge system construction:academic knowledge mining and on-demand application for full d
3、omains and omni scenarios SHA Zifan,CHENG Nan,HUI Yilong,YUE Wenwei,FU Yuchuan,SUN Ruijin State Key Laboratory of Integrated Services Network,Xidian University,Xian 710071,China Abstract:At present,the concepts related to 6G have not been unified,and there is an urgent need for consistent cogni-tion
4、 and definition.Academics and industries lack a clear understanding of the overall development of 6G and the re-search progress in related fields.Therefore,the 6G knowledge base and knowledge system was constructed.Firstly,the existing 6G academic documents were automatically screened and stored in
5、a structured way.Secondly,a 6G knowledge base was constructed on the basis of labeling and standardizing text data.In addition,a comprehensive statistical analysis was conducted across all domains of 6G based on the knowledge base and the technologies such as natural language pro-cessing,deep neural
6、 network and latent tree model were used to realize the extraction and generation of 6G knowledge.Finally,on the basis of large-scale model training,the on-demand knowledge application was realized for diversified ser-vice requirements.Keywords:6G,knowledge base,knowledge system,knowledge tree,on-de
7、mand service 0 引言 随着 5G 技术的蓬勃发展和商用进程的推进,对 6G 的探索日益成为学术界和产业界关注的焦点。标准化组织 3GPP 已完成对 5G NR Rel-17 标准的冻结1,Rel-18 标准的推进工作也正在进行。各大组织和企业纷纷发布 6G 愿景和白皮书,展望 6G并对相关技术和产业进行布局。其中,芬兰奥卢大学发布了全球首个 6G 白皮书,提出了泛在无线智能的愿景2;三星在其 6G 技术白皮书中指明 6G 三大关键服务,分别为真正的沉浸式扩展现实(XR,extended reality)、高质量移动式全息体验以及数字化身3。我国也高度重视 6G 建设,东南大学尤肖
8、虎和王承祥教授联合国内外 24 家科研院校及企业收稿日期:20230506;修回日期:20230906 通信作者:承楠, 基金项目:国家重点研发计划基金资助项目(No.2020YFB1807700)Foundation Item:The National Key Research and Development Program of China(No.2020YFB1807700)174 通 信 学 报 第 44 卷 的50位业内专家发布了面向6G无线通信网络的长文综述,文章从 6G 性能指标、应用场景、垂直行业应用、使能技术、新的范式转换等方面对新一代无线通信进行剖析和展望4。未来 10 年
9、,6G 将引领全领域的技术深化和认知变革,并赋能海量及新型场景、业务下的按需服务。具体来说,6G 有望提供全球覆盖,增强频谱、能源、成本效率,具备更优越的智能水平和安全性5-6,如通过引入雾计算实现未来移动通信网络中通信与计算的融合7。为实现上述愿景,6G 需要具备更高级别的自主决策能力,实现对人机接口的改进更新,并在多样化的环境中实现深度连接8-9。同时,6G 需要具备支持需求动态变化的新业务及未知业务的能力,以构建智能和开放的 6G 生态10-13。由此可见,6G 的变革覆盖各方各面,而智能化是其显著特征和重要内核14-16。然而,当前 6G 学术领域的发展存在两点问题。其一,由于开展研究
10、时间尚短,对 6G 相关领域的探索缺少整体的系统构建和脉络梳理,限制了 6G 理论和技术的深入研究。具体来说,6G 技术的多样性、场景的差异性以及需求的不确定性使整体的研究呈现多元化特征,缺少整体性的 6G 脉络认知将进一步加剧研究工作的发散性。同时,对 6G 相关要素的定义和定性相对滞后于最新 6G 理论探索,6G 全领域知识体系的构建可以为 6G 标准化的阶段性推进提供重要依据。此外,缺少对 6G 全领域的整体性认识和领域间关联的把握,易导致相关研究不具备普适性和泛化性,进一步降低 6G 研究的生命力。其二,仅在现有通信系统中简单应用人工智能算法无法实现“服务随心所想,网络随需而变,资源随
11、愿共享”的 6G 按需服务愿景,在知识嵌入的新型架构体系中实现移动通信和人工智能技术的深度融合已成为迫切需求。为解决上述问题,本文构建了 6G 知识库和知识体系,在对 6G 全领域知识进行抽取和归纳的基础上实现知识的按需应用。对于当前 6G 学术知识的剖析有利于引导 6G 各领域的战略布局和未来发展。同时,6G 知识的引入可实现对于服务需求及其管控的立体感知、决策推断和动态调整4,如长期积累的网络与通信领域知识用来赋能相关的网络管控、优化等。本文提出的 6G 知识库和知识体系是面向 6G 全领域构建的知识集群,对于总览 6G 全貌并赋能全场景按需服务具有重要意义。具体来说,6G 知识库对目前已
12、有的 6G 学术文献进行结构化存储,在初始字段的基础上扩充知识维度。6G 知识体系以 6G 知识库为载体,是 6G 知识库实现知识生长和应用的重要内核,其包含对 6G全领域的统计分析、6G 知识的抽取和生成以及对特定知识的标注,并在此基础上实现按需的知识应用。其中,6G 全领域统计分析利用 6G 知识库中的文献元数据,对 6G 的发展趋势进行呈现和预测,并对 6G 学术领域和热词等进行分析;面向 6G 知识抽取与生成,本文利用海量 6G 文献的语料信息生成了 6G 知识树;知识标注方面,本文对 6G 典型场景、使能技术、关键性能指标(KPI)等重要属性进行标注;在知识标注和知识抽取的基础上,实
13、现场景识别、技术关联、按需知识推荐等知识应用。综上所述,本文的主要贡献如下。1)构建了 6G 知识库和知识体系,实现了对 6G学术知识从抽取、挖掘到按需应用的全生命周期闭环管控。2)基于 6G 知识库,对 6G 学术进行统计分析,包含文献随时间的分布情况、热点领域和热词的分布情况,在此基础上实现了对 6G 学术发展的预测以及 4G、5G、6G 的对比分析。3)利用分层主题检测算法从海量学术数据中生成了 6G 知识树,实现了对 6G 全领域知识结构的提炼,以及关键词、主题和文献之间的三层关联。本文对 6G 知识树节点及结构数据进行了开源。4)以基于文本生成的 6G 热点推荐为例,展示6G 学术知
14、识的应用,并阐释知识应用对 6G 网络配置、运行和维护的意义。1 6G 知识库及知识体系构建 面对快速发展的 6G 技术,如何对 6G 研究的全貌和具体技术的发展脉络进行智能分析已成为众多科研人员和工程人员的共同需求。为实现对 6G知识的挖掘以及原生智能的嵌入,本文构建了 6G知识库和知识体系。传统的知识库是基于知识且具有 智 能 性 的 系 统,是 人 工 智 能(AI,artifi-cial intelligence)和数据库(DB,database)2 种计算机技术的有机结合17。本文构建的 6G 知识库和知识体系包含对数据智能的存储和挖掘,旨在打造学术知识全生命周期的智能管控平台,有利
15、于洞悉6G 的学术、产业布局高地和未来发展的热点,通过深层次的知识挖掘可实现按需的知识应用。本文将知识的全生命周期管控分为如下 3 个环节。第 9 期 沙子凡等:6G 知识体系构建:面向全域全场景的学术知识挖掘及其按需应用 175 1)从海量非结构化数据中获取目标信息,并进行结构性和规范化的知识存储,即构建知识库。2)对 1)中规范化数据进行处理、标注、分析和推理,从而生成新的知识。3)利用 2)中新获取的知识进行按需的知识应用,并将知识驱动的策略存储至知识库中,实现知识闭环。基于上海交通大学 Acemap18的文献数据库,本文共筛选出 1 754 篇 6G 相关的学术文献,文献主题涵盖 63
16、3 个不同的领域。本文首先对筛选得到的 6G 文献进行预处理,形成规范化的文本数据,从而构建 6G 数据库。6G 数据库中包含 6G 文献的结构化数据,其只具备存储能力;而 6G 知识库在涵盖 6G 数据库的基础上,可以对数据进行标注、分析和推理,从而实现新知识的抽取、生成及存储,具备自扩展和自维护的能力。目前,6G 数据库包含已有 6G 文献的特定 ID、标题、摘要、领域、发表年份以及 DOI 号等初始数据字段。同时,6G 知识库支持纵向(文章数量)和横向(文章属性类别)的扩展,目前已扩充包含场景、技术、KPI 在内的多个属性维度。Acemap 作为完全由国内自主研发的新式学术搜索系统,目前
17、已涵盖全领域共计221 302 966 篇学术文献,基于此构建的 6G 知识库也延续了其全面性的特点。同时,Acemap 将学术实体组织成网络,通过网络分析和数据挖掘的方法展现实体间的关联性,使基于此构建的 6G 知识库具有准确性的特点。此外,基于 Acemap 构建的 6G知识库具备文献的补充和知识的抽取、生成及存储能力,因此具备可扩展性。6G 知识库在结构化 6G 学术数据的基础上,结合专家知识和自然语言处理技术19-21,实现自顶向下和自底向上相结合的知识体系构建。本文对专家知识、自顶向下构建和自底向上构建进行如下说明。1)专家知识22是指特定领域专家水平的经验与认知,能够利用人类专家的
18、先验性认识和共识性准则来理解、归纳和总结该领域要素及问题,如当前对 6G 场景和应用方向的一致性认识,以及移动通信发展过程中的普遍性原理。2)自顶向下构建是指从结构化数据源中提取本体和模式信息,并加入知识库中。3)自底向上构建是指利用标注和归纳等方法得到所需的数据模式,选择其中置信度较高的信息,加入知识库中。专家知识具备可靠性和规范性,然而其往往面向特定领域及方向,具有领域的局限性。而且专家知识的形成需要长时间的经验积累,需要结合基于人工智能技术的自顶向下构建方式,提升知识体系构建的整体性和高效性。6G 知识体系包含统计分析、知识抽取及生成、知识标注三层内核,并面向按需的知识应用。同时,依据特
19、定字段,可自动化分析对应场景、技术以及服务需求,实现真正意义上的全场景按需服务。6G知识库及知识体系构建流程如图 1 所示。图 1 6G 知识库及知识体系构建流程 176 通 信 学 报 第 44 卷 具体来说,6G 数据库包含 1 754 篇 6G 文献的元数据字段和扩展属性,对这些结构性数据按照发表年份、文献领域等进行统计分析,可实现对当前 6G 学术的发展态势的整体把握,在此基础上可进一步预测未来的发展趋势。除了统计分析,可应用自然语言处理技术和深度学习方法对 6G语料进行处理和训练,实现 6G 知识的抽取和生成。本文利用主题分析算法对 6G 脉络进行梳理,生成 6G 知识树;同时,本文
20、利用获取的 6G 文献语料进行语言模型23的训练,结合 Transformer24、注意力机制25,以及 BERT 模型26,训练了面向6G 的语言模型 6G-BERT,未来可应用于多种6G 相关的下游知识服务;此外,利用神经网络模型,本文实现了基于文本生成的 6G 热点推荐,未来可面向 6G 各子场景,进行细粒度的热点推荐和关联。除了面向元数据的统计分析和知识抽取外,本文还进行了规则化的知识标注工作,目前主要对每篇文献的场景、技术、指标进行针对性标注。标注后的数据可应用于广泛的按需知识服务,目前主要涉及场景识别、技术关联和 KPI 聚类等,未来将面向更多科研及应用需求。此外,上述三层内核之间
21、也存在交互关联。知识标注为知识抽取及生成提供数据样本,用于相关的模型训练驱动;知识抽取及生成为知识标注提供标注维度;知识抽取及生成为统计分析提供有统计意义的数据维度;统计分析结果可以引导特定知识的抽取和生成。三层内核推动 6G 知识体系实现面向 6G 特定领域的知识蒸馏,其输出进一步反馈至6G 数据库,实现知识的循环运作,即知识闭环。本文所提到的知识抽取、知识生成和知识蒸馏定义如下。1)知识抽取是指从各种信息源中自动或半自动地提取与 6G 通信技术相关的信息、数据和概念的过程。这可以从语料等来源中抽取关键词、场景、需求、技术参数等,以建立一个关于 6G 全领域的知识库或信息集合。2)知识生成是
22、指基于已有的信息和数据,通过分析、合成、推理等方式,产生新的 6G 领域知识的过程27。这包括提出的新理论、架构、策略以及技术方案等,以填补现有知识中的空白,推动 6G领域的研究和发展。3)知识蒸馏是指将复杂的6G领域知识转化为更简单、更易理解的形式,以便向 6G 受众传递和共享28。这可以通过总结、归纳、概括和解释等方式实现,使各类人群能够按需理解和获取有关 6G研究的基本概念和原理。由此可见,6G 知识库具备可扩展性,知识并非局限于已定义好的规则,而是在领域范围内,实现意料之外、情理之中的推理和发掘。此外,利用 AI 技术,可实现对特定知识概念的呈现、服务需求的挖掘、决策的推荐等,这些结果
23、将继续作为知识库的输入,实现真正意义上的知识生长和知识闭环。Mestres 等29提出一种知识定义的网络(KDN,knowledge-defined network)架构,KDN 利用知识平面接收分析平台的数据并进行分析,在此基础上将数据通过机器学习算法转化成知识,借助知识进行网络配置与优化决策。6G 知识库和知识体系可以融合知识平面中的知识,该融合有助于在 6G 网络的配置、优化和决策过程中更好地利用多源、多维度的知识30-34,从而提升网络性能,具体来说包含如下 5 个方面。1)知识共享与整合。将从 6G 知识库中标注和生成的知识与知识平面中经数据分析得到的知识进行共享和整合。可以通过建立
24、统一的知识表示方式,使从不同来源获取的知识可以相互关联、映射和融合。2)知识更新与动态调整。知识平面中的数据分析可以持续地为 6G 知识库提供新的信息和数据,从而使知识库能够保持更新和动态调整。这有助于知识库持续地适应 6G 网络的发展和变化。3)智能决策支持。与知识平面融合后的 6G 知识库可进一步提升网络配置和优化决策的智能性和按需部署能力。知识平面提供的分析结果可以为决策提供实时性支持,6G 知识库生成的知识可以为决策提供更多的背景及理论支持。4)跨领域知识应用。与知识平面融合后的知识库可以关联多个领域知识,促进不同领域间的融合与创新。例如,将网络通信知识与人工智能、物联网等领域的知识结
25、合,推动 6G 网络在多个跨域场景中的知识应用。5)知识质量检测与验证。与知识平面融合后的知识库可以更好地进行知识质量的验证与优化。从6G 知识库中生成的知识可以通过与知识平面中数据分析结果的对比,实现对知识的检验和修正,从而提升知识的准确性和可靠性。在对知识库进行多轮的规则清洗和人工筛查第 9 期 沙子凡等:6G 知识体系构建:面向全域全场景的学术知识挖掘及其按需应用 177 之后,本文归纳并定义了 6G 的十大典型场景,分别为全感官沉浸式通信、立体多栖交通、孪生虚拟交互、全功能全自动绿色工业、通感算一体化网络、智慧城市与生活、全覆盖跨域空间通信、泛在智能按需交互、抗干扰安全可信网络、灾害适
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 知识 体系 构建 面向 全域 场景 学术 挖掘 及其 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。