协调多尺度决策系统中基于测试代价的属性与尺度选择_吴迪.pdf
《协调多尺度决策系统中基于测试代价的属性与尺度选择_吴迪.pdf》由会员分享,可在线阅读,更多相关《协调多尺度决策系统中基于测试代价的属性与尺度选择_吴迪.pdf(15页珍藏版)》请在咨信网上搜索。
1、 协调多尺度决策系统中基于测试代价的属性与尺度选择吴 迪,廖淑娇,范译文,摘 要对多尺度决策系统进行处理可以使复杂的问题简单化,属性与尺度的同步选择是该处理过程中一个重要方法此外,现实中数据处理经常需要考虑代价因素的影响,但是,目前研究还没有在属性与尺度的同步选择中考虑代价因素为了解决这一问题,文中基于测试代价,研究协调多尺度决策系统的属性与尺度选择首先,构造相应的粗糙集理论模型,模型中的定义及性质同时考虑属性和尺度这两个要素,并给出基于测试代价的属性尺度重要度函数然后,基于适用于多尺度决策系统的粗糙集概念及性质,提出属性与尺度同步选择的启发式算法在 数据集上的实验表明,文中算法可大幅降低总测
2、试代价,提升计算效率关键词 属性与尺度选择,测试代价,多尺度决策系统,单调性引用格式 吴 迪,廖淑娇,范译文协调多尺度决策系统中基于测试代价的属性与尺度选择模式识别与人工智能,():中图法分类号 ,收稿日期:;录用日期:,;,国家自然科学基金项目()资助 ()本文责任编委 张燕平 闽南师范大学 数学与统计学院 漳州 闽南师范大学 福建省粒计算及其应用重点实验室漳州 闽南师范大学 数字福建气象大数据研究所 漳州 闽南师范大学 数据科学与统计重点实验室 漳州 ,第 卷 第 期模式识别与人工智能 年 月 ,():粗糙集理论能有效处理数据的不确定性、不完备性和不一致性等问题经典的 粗糙集模型假设信息系
3、统和决策系统中的对象在每个属性下只能有一个属性值,然而在现实生活中,对象在某个属性下可能会有多个属性值为了解决这一问题,等定义多尺度决策系统(在一些研究中,多尺度也称为多标记或多粒度),并进行尺度选择(也称为粒度选择、标记选择或尺度组合选择),即以保持最细尺度下的分辨能力为前提选择合适的尺度关于多尺度决策系统,有一些研究主要侧重于尺度选择 等利用补模型和格模型分析多尺度决策表的最优尺度选择李金海等在多粒度背景下,基于信息熵设计最优粒度选择算法 等利用序贯三支决策理论,给出最优尺度的更新律 等提出基于正区域一致性的补模型和格模型,并给出尺度选择算法但是,尺度选择更适合低维的多尺度数据集,对于高维
4、的多尺度数据集,主要的研究方法之一是在尺度选择的基础上再进行属性约简杨璇等建立模糊相似关系的决策粗糙集模型,并给出最优尺度选择和约简方法 等研究适用于连续数据的多尺度模糊决策系统,提出启发式尺度选择算法和前向属性选择算法杨烨等利用证据理论,在尺度选择的基础上,对不协调广义多尺度序信息系统再进行规则提取 等首先对广义多尺度信息系统进行尺度选择,再提取规则但是,在尺度选择的基础上再进行属性约简并不适用于代价敏感的多尺度数据,原因是此方法的目的是找到保持最细尺度下属性全集分类能力的最粗尺度组合和最小维属性子集,然而所得属性子集在该尺度组合下的总测试代价不一定是最小的因此对于代价敏感的多尺度数据,需要
5、进行属性与尺度的同步选择近年来,一些学者开始研究多尺度决策系统中的属性与尺度的同步选择 等讨论基于优势度的多尺度直觉模糊决策表的最优尺度选择和规则获取算法 等建立尺度空间的序贯三支决策模型,并且结合 图,给出高效的同时选择属性与尺度的方法 等提出将序贯三支决策与多尺度决策表结合的有效方法,同时进行最优尺度选择和属性约简张庐婧等构造多尺度邻域信息粒,并在此基础上给出可同时进行最优尺度选择和特征选择的算法金铭等结合辨识矩阵与图论,提出最优尺度约简的算法上述工作本质上都是在多尺度决策系统中进行属性与尺度的同步选择,然而都未考虑代价因素从实际应用的角度上看,可能不够经济实用代价敏感学习是机器学习和数据
6、挖掘领域的一个重要研究方向,是处理分类不平衡问题或涉及代价问题的一种有效方法,其中测试代价是经常被考虑的一种代价现实中,为了获得对象某个数据项的值,往往需要对其进行测试,而测试付出的代价就是测试代价,并且不同数据项的测试代价可能不同一些学者研究单尺度决策系统的代价敏感学习问题,但对于多尺度决策系统的相关研究较少张雪秋定义代价敏感的多尺度决策系统,并对其进行尺度选择张清华等在代价敏感环境下,分别计算多尺度决策系统的最优粒度和最优尺度组合但是,目前还没有多尺度决策系统中基于代价敏感的属性与尺度同步选择的相关研究工作鉴于上述情况,本文在传统的协调多尺度决策系统(即属性值都是名词型的协调多尺度决策系统
7、,为了简便起见,下文简称其为多尺度决策系统)中进行基于测试代价的属性与尺度同步选择首先,建立多尺度决策系统的粗糙集理论模型,介绍同时考虑属性和尺度这两个要素的概念,如等价类、上下近似、正区域、边界区域等,并研究这些概念的性质值得注意的是,以往相关的粗糙集理论模型中的概念和性质往往只涉及属性和尺度这两个要素之一,而本文模型中的概念和性质同时考虑这两个要素然后,提出基于测试代价的属性尺度重要度函数,并基于适用于多尺度决策系统的粗糙集概念及性质,设计属性与尺度同步选择的启发式算法该算法能选择合适的属性子集和尺度,既保持多尺度决策系统的分辨能力不变,又使总测试代价最小化最后,在 个 数据集上进行实验,
8、验证本文算法的有效性和实用性,并与文献算法、文献算法以及最细尺度下的原数据(即没有进行属性约简的原数据)进行对比实验表明,本文算法可以大幅降低总测试代价并且,算法由于使用概念的单调模式识别与人工智能()第 卷性进行加速,具有较高的计算效率多尺度决策系统的粗糙集理论本节简要回顾经典粗糙集的一些基础概念和性质由于某些概念及性质不适用于多尺度决策系统,因此着重介绍适用于多尺度决策系统的定义与性质,这些定义和性质同时考虑属性和尺度这两个要素 经典粗糙集基础知识首先回顾经典粗糙集里的一些重要概念和性质,如等价类、上下近似、正区域、边界区域等在粒计算中,信息粒子经常由等价类表示假设 为论域,是一个非空的有
9、限集合,则对于 中的任意对象,都存在一个关于 的等价类 的构成与给定的属性集相关,其中包含的所有对象在给定的属性集下与 都是不可分辨的对象 关于属性集的等价类定义如下定义 称五元组 (,)为一个决策系统,其中,为论域,为属性全集,为属性 的值域,为信息函数,决策属性则对于任意对象,关于属性子集的等价类定义为 ,其中、分别表示对象和对象在属性下的值换句话说,等价类中包含的对象,就是在属性子集 的所有属性下与对象 的属性值都相同的对象论域 关于属性子集 的等价关系定义如下定义 给定一个决策系统 (,),则论域 关于属性子集 的等价关系定义为(,),由定义 中对等价关系的定义,可得到等价关系 对论域
10、 的划分:等价关系可以把论域划分成多个互不相交的集合,并且这些集合的并集是论域因为本文应用的上下近似是基于包含度函数定义的,所以在引入上下近似之前需要先介绍包含度函数定义 给定一个决策系统 (,),对于,则在中关于属性子集 的包含度函数为:(),根据定义,决策系统的上下近似定义如下定义 给定一个决策系统 (,),对于,则关于属性子集的下近似和上近似可以分别定义为()(),()()在计算论域内所有对象 的包含度的过程中:当包含度大于 时,与 的交集非空,对象 属于上近似;当包含度为 时,完全包含于,对象 属于下近似同时考虑属性和尺度的粗糙集理论模型在现实生活中,对一个事物的观察经常可以得到不同尺
11、度的观测值对多尺度决策系统进行处理,可以使复杂问题简单化,从而有助于复杂问题的分析和解决由于 节的粗糙集理论知识在多尺度决策系统中并不适用,因此为了解决这一问题,本节介绍后续讨论过程会用到、并且适用于多尺度决策系统的粗糙集概念及性质,这些概念和性质都涉及属性和尺度这两个要素为了简便起见,假设节提出的属性全集中的属性都是多尺度属性,且都有 个尺度本文默认所有属性的尺度都是从细到粗的值得注意的是,决策属性为特殊的单尺度属性,如表所示的多尺度决策系统表 有 个尺度的多尺度决策系统 第 期 吴 迪 等:协调多尺度决策系统中基于测试代价的属性与尺度选择 表 的多尺度决策系统可以分解成 个单尺度决策系统:
12、第 个尺度决策系统、第 个尺度决策系统和第 个尺度决策系统 在下文中,为了方便起见,只讨论所有属性都选择相同尺度的情况,而不讨论选择不同尺度的情况令 表示尺度,属性全集和所选尺度结合起来可形成有序对(,)同样,对于,可简写为有序对(,)称六元组 (,)为多尺度决策系统(,)多尺度决策系统里面的等价类具体定义如下定义 给定一个多尺度决策系统 (,),对于任意的对象,对象关于有序对(,)的等价类定义为(,)(,)(,),其中,(,)表示属性选择尺度时,对象的属性值和对象 的属性值相同可见,适用于多尺度决策系统的等价类和经典粗糙集的等价类的不同点主要是:适用于多尺度决策系统的等价类的定义既考虑属性又
13、考虑尺度事实上,多尺度决策系统中同一属性的不同尺度之间的属性值存在密切关系给定一个多尺度决策系统 (,),对于任意的属性 和任意的尺度 ,存在满射,(,)(,),从而(,),(,),称,为一个尺度信息转换并且,若 ,存在满射,(,)(,),其中,从而(,),(,),()由定义 不难得到如下关于等价类的性质性质 给定一个多尺度决策系统 (,),则 ,关于(,)的等价类满足如下性质:)自反性对于 ,(,);)对称性 对于 ,若(,),则 (,)在定义 的基础上,可得到适用于多尺度决策系统的等价关系定义 给定一个多尺度决策系统 (,),对于任意的属性子集 ,则论域 关于(,)的等价关系可定义为(,)
14、(,)(,)(,),故(,)对论域 的划分(,)(,)结合定义,若(,),则称 (,)是协调的;若(,),则称是不协调的本文讨论的是协调的多尺度决策系统根据定义 和定义 更新包含度函数更新后的包含度函数为,()(,)(,),当包含度函数大于 时,(,)与 的交集非空,此时 属于上近似;当包含度函数等于 时,(,)包含于,此时 属于下近似基于更新后的包含度函数,不难得到适用于多尺度决策系统的上下近似定义 给定一个多尺度决策系统 (,),则关于(,)的上下近似定义如下:(,)(),(),(,)(),()定义 给定一个多尺度决策系统 (,),决策属性 可将 划分成互不相交的多个集合,设 ,则决策属性
15、 关于(,)的上下近似可表示为(,)()(,)(),(,)()(,)()由上式可以容易看出,决策属性关于(,)的上(下)近似是 ,中所有划分 的上(下)近似的并集事实上,下近似(,)()同时也是正区域,即(,)()(,)()(,)()决策属性 关于(,)的上近似与下近似的差为边界区域:模式识别与人工智能()第 卷(,)()(,)()(,)()(,)()(,)()由定义 得到如下性质 性质 给定一个多尺度决策系统 (,),则)(,)(),)(,)(),)(,)()(,)(),)(,)()(,)()上述介绍的等价类、上下近似、正区域和边界区域等概念分别关于属性子集和尺度存在单调性,这些单调性可以加
16、速算法,减少算法的计算量性质 关于属性子集的单调性 给定一个多尺度决策系统 (,),则满足如下性质:),(,)(,);)(,)(,);),(,)()(,)(),(,)()(,)();)(,)()(,)(),(,)()(,)()证明先证)对于(,),由定义可知(,)(,),由于 ,因此(,)(,),故 (,),可得(,)(,)再证)对于(,)(,),可知(,)(,),由于 ,因此(,)(,),故(,)(,),可得(,)(,)再证)对于 (,)(),可得(,),由性质)可知(,)(,),所以 (,)(),故而(,)()(,)()类似可证(,)()(,)()最后证)假设 ,由性质)可知(,)()(,
17、)(),由定义 知(,)()(,)(),因此显然(,)()(,)()同样,由性质)可知(,)()(,)(),又因为(,)()(,)()(,)(),故而(,)()(,)()性质 表示正区域随着属性的增多而扩大,与此同时边界区域随着属性的增多而缩小事实上,不只是属性子集,尺度也会影响上述概念的单调性,具体如下所示性质 关于尺度的单调性 给定一个多尺度决策系统 (,),则满足如下关系:),(,)(,);)(,)(,);),(,)()(,)(),(,)()(,)();)(,)()(,)(),(,)()(,)()证明 先证)由式()可知,存在尺度信息转换,使得对于 ,(,),(,)因为对于 (,),(,
18、)(,),所以(,),(,),(,)(,),故 (,),可得(,)(,)第 期 吴 迪 等:协调多尺度决策系统中基于测试代价的属性与尺度选择)的证明过程类似于性质,为了简便起见,不再单独证明性质 表示正区域随着尺度的增大而缩小,与此同时边界区域随着尺度的增大而扩大结合性质 和性质,可以得到如下性质 性质 给定一个多尺度决策系统 (,),则满足如下性质:),(,)(,);)(,)(,);),(,)()(,)(),(,)()(,)();)(,)()(,)(),(,)()(,)()证明 为了简便起见,只证明(,)()(,)()因为 ,由性质 可得(,)()(,)()又因为 ,由性质 可得(,)()(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 协调 尺度 决策 系统 基于 测试 代价 属性 选择 吴迪
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。