面向服务等级的网络流多任务分类方法.pdf
《面向服务等级的网络流多任务分类方法.pdf》由会员分享,可在线阅读,更多相关《面向服务等级的网络流多任务分类方法.pdf(10页珍藏版)》请在咨信网上搜索。
1、第 卷第 期重庆邮电大学学报(自然科学版).年 月 ().:./.面向服务等级的网络流多任务分类方法收稿日期:修订日期:通讯作者:董育宇 .基金项目:国家自然科学基金():()赵 杰董育宁魏 昕(南京邮电大学 通信与信息工程学院南京)摘 要:在网络流分类实践中网络运营商通常只需要知道网络流所需的服务类别()就可对网络流优先级和资源分配做出决定 为了满足用户对体验质量的需求提出了面向服务等级的网络流多任务分类方法 该方法是直接进行面向 的流分类而不需要推断应用类型 同时提出多任务框架利用领域知识定义宏特征组及应用合作博弈中的 模型来合理分析特征并用决策树分箱来解决 阈值划分问题 采用真实网络数据
2、集进行实验通过在少量标记数据的情况下优化网络参数和调整各网络模型时间损耗和分类准确性的稳定相关系数 结果表明该方法分类准确度(提高了.)和时间消耗(减少了.)性能优于现有文献方法同时分析了多分类实验结果并给出有关建议关键词:网络流分类多任务学习 特征分析阈值划分中图分类号:文献标志码:文章编号:()(.):().:).(.)(.).:引 言网络流分类()技术在互联网中有着广泛的应用如资源分配、服务质量()保证、网络服务提供商()计费和异常网络流量检测等 早期 经过了以下几个研究阶段:基于端口、深度包检测、主机行为 但是这些方法无法适用于加密流 随着机器学习逐渐取而代之出现了包括朴素贝叶斯估计、
3、无监督聚类、支持向量机、随机森林和 等流分类模型 近年来随着互联网流量中出现更为复杂的模式深度学习模型在 方面取得了不错的成绩其学习复杂模式和自动提取特征能力使其成为 的理想选择尤其是卷积神经网络()和循环神经网络()但这都需要收集大量的标记训练集而且都是面向应用类型上的 无法满足高速变化且海量数据的流媒体环境 实际上 通常只需要知道数据流的所需服务类别()就可决定其优先权和资源分配为此本文研究直接为数据流分配 标签而不必考虑其应用类别 同时用多任务学习()方法中各任务间共享模型信息的特性来减少对标记数据的使用除了建立模型框架之外还需要合理解释模型选择的理由 这对于直接 方法来说是一个具有挑战
4、性的问题因为它忽略了应用类型识别的阶段 本文借鉴博弈论通过将学习模型作为一个等价的合作博弈模型来计算每个特征对结果的影响()由于每条数据流有数百个特征要精确计算所有特征的 值将导致很高的时间和空间复杂度 其次是很难理解和分析每个特征对总体 分类的贡献作用 为此在实验中首先基于领域知识将流特征划分为 个宏特征()分别在 下进行 值计算选择对模型贡献突出的特征映射为 再将每个 映射为一种服务类型 本文的主要贡献如下)选择合适特征映射为 标签 包括基于领域知识将特征分为 对每类 进行 分析选择出对模型贡献大的特征同时分析特征之间的皮尔 森 相 关 系 数()为多任务模型()选择出贡献最大的特征进而映
5、射为 标签任务与现有方法从用户角度和获取特征难易程度来选取 任务不同本文考虑了选取 的合理性)等级优化分析 分析每个 任务等级的分布情况利用决策树分箱()算法优化每个 等级阈值()的划分提高总体准确性 现有方法通过直方图和线性计算来划分阈值容易导致在预处理部分增加错分率 本文中通过 合理化阈值划分能够降低误分率)优化网络参数 优化调整各网络模型时间损耗和分类准确性的稳定相关系数 背景和相关工作.流分类模型常用的流分类机器学习方法分为有监督、无监督和半监督学习方法 文献的平均聚类时间仅为传统凝聚分类器的三分之一左右在时间消耗上有着较明显的优势然而由于其简单性、手动特征提取以及缺乏捕获复杂模式的高
6、学习能力其准确率有所欠缺 随着深度学习方法在图像分类、语音识别等各种问题上的成功应用研究人员将这些方法用于流量分类问题中 如 和堆叠式自动编码器()框架该框架使用 从原始网络流量中提取高级特征利用 对原始流量的统计特征()进行编码以减少信息损失 虽然深度神经网络在一定程度上解决了机器学习初步人工特征选择的缺点但却需要大量的标记数据集 既继承深度学习自动提取特征的优点又能使用少量标记数据完成较好的分类准确性文献提出通过将原始数据流转换为图片然后使用 来预测流类别程序 除了可以将原始字节数据转换成图片文献 中利用再生核希尔伯特空间将每个流的时间序列特征转换为二维图像生成的图像被用作 模型的输入其模
7、型以超过 的准确率优于经典的机器学习方法 二维图像的数据输入相比于原始流的输入具有更丰富的信息 但如果对一些短流可能无法提取到足够的特征导致在转化图片时会用大量的无用信息()填充 对于短流的流分类更符合早期在线流量分类问题 文献讨论了 能够处理加 重 庆 邮 电 大 学 学 报(自然科学版)第 卷密流量分类问题的根本原因并提出基于长短时记忆()的双向流序列网络()其从原始流中学习出代表性特征然后输入到端到端分类模型对其进行分类并利用加密流的包长度和方向信息构造双向流量序列得到不错的准确性文献用顺序消息特征()和 个成功提取的消息大小信息的输入特别是对于中值超过 个消息段的大流量就可实现早期在线
8、流量分类 这些方法都是面向应用类型的分类也就是根据应用类别为数据流分配标签无法解决新应用的不断出现 为此可以研究面向 的网络流分类直接标注 标签而不必考虑它们的应用类别标签.简介在合作博弈论的启发下利用 构建一个加性的解释模型所有的特征都视为“贡献者”对于每个预测样本模型都产生一个预测值 就是该样本中每个特征所分配到的数值 其最大的优势是 能反映出样本中特征的正负影响力 本文方法本文的框架模型主要分为 个部分:数据预处理、特征 分析和.数据预处理为了解决标记数据问题可以将数据流分类构造成一个 其中带宽吞 吐 需 求()和 时 间 敏 感 度()任务随流量分类()一起预测 对于前 个任务使用大量
9、容易获得的无标签样本而对于 任务使用少量的有标签样本可以获得较高的准确率 因此 避免了需要一个大的标记流量数据集 分别在 公共数据集和南邮数据集上进行实验验证了该预处理的有效性和合理性.特征 分析基于领域知识将 个 分为两类 利用 分析每类 下的特征对 贡献分别讨论 ()、()、和 的 下 个特征对模型的贡献值 图 为 应用类型的特征 分布 横坐标为 值每个点代表一个样本颜色越红说明特征本身数值越大颜色越蓝则说明数值越小 可以看出 ()是一个很重要的特征它基本上与 呈负相关 ()也会明显影响 但不同的是它与 成正相关图 特征的 贡献榜.除了对于单个数据进行解释之外还可以对整个模型特征的重要度进
10、行分析这里只考虑在本文模型下的特征贡献榜、重要度分别在 和 两类 计算特征的 图 为统计特征序列箱形图图 为 下所有 的 部分图 从图 可以看出 对模型的贡献最大其次是 从图 可以看出 贡献最大 各任务之间应该尽量不相关这样可以最大程度地发挥任务间的共享特性 所以利用 来计算特征之间的相关性 总体相关系数 定义为 个变量、(特征)之间的协方差和两者标准差乘积的比值为 ()()()()()根据 的特性和在.中定义服务等级的优先级有 种 该标准建议最高优先级为 应用于关键性网络流量 如路由选择信息协议()和开放最短路径优先()协议的路由表更新 优先级 和 主要用于延迟敏感()应用程序如交互式视频和
11、语音 优先级 到 主要用于受控负载()应用程序如流式多媒体和关键性业务流量 同时.说明网络管理员可以根据实际来决定映射情况所以在本文中将 和 扩展为 种不同的 任务第 期 赵 杰等:面向服务等级的网络流多任务分类方法图 特征重要度.()用 等级(常为 个)来衡量用户服务等级所以 大多继承了 下 个等级来确定流量优先级和资源分配合理优化 等级也十分重要本文采用 来合理化 等级 对所有样本只包含两个 ()和)的序列(样本标签)讨论 和 两种 任务 数据分布特性其箱形图分布分别记为 和 如图 所示 从图 可以看出不同应用类型有较明显的集中区域分层现象 的 集中值最高 的 集中值最低从图 可以看出 和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 面向 服务 等级 网络 任务 分类 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。