分享
分销 收藏 举报 申诉 / 21
播放页_导航下方通栏广告

类型基于约束的关联规则.ppt

  • 上传人:pc****0
  • 文档编号:13061977
  • 上传时间:2026-01-12
  • 格式:PPT
  • 页数:21
  • 大小:126.50KB
  • 下载积分:10 金币
  • 播放页_非在线预览资源立即下载上方广告
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    基于 约束 关联 规则
    资源描述:
    单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第六章在大型数据库中挖掘关联规则,报告人:张荣祖,2001/11/28,6.6.1 基于约束的挖掘,使用约束的必要性,在数据挖掘中常使用的几种约束:,知识类型约束:,指定要挖掘的知识类型,如关联规则,数据约束:,指定与任务相关的数据集,Find product pairs sold together in,Vancouver,in,Dec.98,.,维/层次约束:,指定所用的维或概念结构中的层,in relevance to,region,price,brand,customer category,.,规则约束:,指定,要挖掘的规则形式(如规则模板),单价,(,price$200).,兴趣度约束:,指定规则兴趣度阈值或统计度量,如(,min_support,3%,min_confidence,60%).,假定,AllElectronics,的一个销售多维数据库有如下关系:,Sales(customer_name,item_name,transaction_id),Lives(customer_name,region,city),Items(item_name,category,price),Transaction(transaction_id,day,month,year),(1)mine associations as,(2)lives(C,_,”,Pudong,”)sales(C,I,S)=sales(C,JT),(3)from sales,(4)where S.year=1999&T.year=1999,&I.category=J.category,(5)group by C,I.category,(6)having sum(I.price=500,(7)with support threshold=1%,(8)with confidence threshold=50%,Lives(C,_,”,Pudong,”)Sales(C,”Census_CD”,_)Sales(C,”MS/Office”,_)=Sales(C,”MS/,SQLSever,”,_)1.5%,65%,6.6.2 约束的分类,单调性约束,(,monotone constraint),反单调性约束,(,anti-monotone constraint),可转变的约束,(,convertibale,constraint),简洁性约束,(,succinct constraint),约束的有关概念,项目集:,I=i1,i2,im,交易:,T=,模式,S,是项目集的子集,,S=i,j1,i,j2,i,jk,模式,S,包含与,T,T=,iff,S=It;,S,是,S,的子模式(,subpattern,),且,S,是,S,的,超模式(,superpattern,),if,有,S=v,v,是,S,的一个项集,约束,C,m,是,单调的,iff,.,对于任给的满足,C,m,的项集(模式),S,每一个,S,的超集都能够满足,C,m,e.g:C,m,:min(S)C(S),则,C(S),是反单调可转变的,可转变性约束的例子1:,Avg,(S),V,令,I,为一组以升序排列数值的项目集,E.g.I=1,3,4,6,8,9,,,R,意指升续,Avg,(S)=,v,是反单调可转变的,如果,S,是,S,的一个后缀,那么,avg,(S),=,avg,(S),6,8,9 is a suffix of 3,4,6,8,9,avg,(6,8,9)=23/3,avg,(3,4,6,8,9)=6,如果,S,满足约束,avg,(S),v,则,S,也满足,可转变的约束 2,单调可转变的,1,.,C(S),既不是单调性约束,也不是反单调性约束;,2.若存在,顺序,R,使得经,R,排序后的,I,具有如下性质:,任给,Ssuffix_S,if C(S)=C(S),则,C(S),是单调可转变的,可转变性约束的例子 2,Avg,(S),V,令,I,为一组以降序排列数值的项目集,E.g.I=9,8,6,4,3,1,,R,意指降续,Avg,(S),v,是单调可转变的,如果,S,是,S,的一个后缀,那么,avg,(S),avg,(S,),8,4,3 is a suffix of 9,8,4,3,avg,(9,8,4,3)=6,avg,(8,4,3)=5,如果,S,满足约束,avg,(S),v,则,S,也满足,8,4,3,satisfies constraint,avg,(S)4,so does 9,8,4,3,简洁性约束,一个项目子集,I,s,是一个,简洁集,(,succinct set),如果对于某些选择性谓词,p,该项目子集能够表示为,p,(I),,此处,,是一个选择符,SP2,I,是一个,强简洁集,(,succinct,power set),如果有一个数目不变的简洁集,I,1,I,k,I,SP,能够用,I,1,I,k,的并、差运算表示出来,be expressed in terms of the strict power sets of I,1,I,k,using union and minus,约束,C,s,是,简洁的,假如,SAT,Cs,(I),是一个强简洁集,简洁性约束的举例,约束规则,v S,S V,S V,S V,min(S)v,min(S)v,min(S)v,max(S)v,max(S)v,max(S)v,count(S)v,count(S)v,count(S)v,sum(S)v,sum(S)v,sum(S)v,avg,(S)v,(frequent constraint),简洁性,yes,yes,yes,yes,yes,yes,yes,yes,yes,yes,weakly,weakly,weakly,no,no,no,no,(no),几种约束之间的关系,Succinctness,Anti-,monotonicity,Monotonicity,Convertible constraints,Inconvertible constraints,频繁数据集应用举例,交易数据库,TDB,如下所示,,支持度,为 3,频繁项目按照,降续,排列:,a:5;e:4;,b:3;c:3;d:3;f:3,Transaction_ID,Items In Transaction,100,a,e,c,d,f,200,a,b,300,a,e,c,f,400,a,e,b,c,d,f,500,a,e,b,d,频繁数据集应用举例(续),将排序后的每次交易的项目列表的,前缀项目,映射到条件数据库,TDB|f;TDB|d;TDB|c;TDB|b;TDB|e,频繁集的生长过程,性质,:如果模式,在,TDB|f,中是频繁的,则,f,在,TDB|f,中也一定是频繁的,频繁集的生长过程,1,.在,TDB|f,中找到相应的频繁项目集,被称为,f,的条件频繁项目集,2,.对于每一个在,中的频繁项目,e,,找出,TDB|,ef,中相应的频繁项目集,这是一个递归的过程,将约束用于频繁集的生成,CaSum(S)180,如果,不满足约束,则不必产生,的条件项目集,也不必产生,的条件数据库,TDB|,Exam2:Sum(a,b)=200,如果,满足约束,则不必对条件数据库,TDB|,中的其余部分用,Ca,进行约束检查,此处,是在,TDB|,中 的频繁项目集,(No constraint checking in the remaining conditional database TDB|,if satisfies the constraint.),小结,常见的4种约束类型,规则约束的分类及其性质,I.,单调/反单调,ii.,可转变的,iii.,简洁的,CFG,算法及其改进,
    展开阅读全文
    提示  咨信网温馨提示:
    1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
    3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
    4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
    5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
    6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

    开通VIP折扣优惠下载文档

    自信AI创作助手
    关于本文
    本文标题:基于约束的关联规则.ppt
    链接地址:https://www.zixin.com.cn/doc/13061977.html
    页脚通栏广告

    Copyright ©2010-2026   All Rights Reserved  宁波自信网络信息技术有限公司 版权所有   |  客服电话:0574-28810668    微信客服:咨信网客服    投诉电话:18658249818   

    违法和不良信息举报邮箱:help@zixin.com.cn    文档合作和网站合作邮箱:fuwu@zixin.com.cn    意见反馈和侵权处理邮箱:1219186828@qq.com   | 证照中心

    12321jubao.png12321网络举报中心 电话:010-12321  jubao.png中国互联网举报中心 电话:12377   gongan.png浙公网安备33021202000488号  icp.png浙ICP备2021020529号-1 浙B2-20240490   


    关注我们 :微信公众号  抖音  微博  LOFTER               

    自信网络  |  ZixinNetwork