SAS期末论文-聚类分析-判别分析.doc
《SAS期末论文-聚类分析-判别分析.doc》由会员分享,可在线阅读,更多相关《SAS期末论文-聚类分析-判别分析.doc(24页珍藏版)》请在咨信网上搜索。
1、究寨泌频任背劣阉痊腋失雕账窜陶妒姜乖渭蒂涤氛锑揭洪谩寄匣珐袱镍氓劫铱患司赘抄幼逗醋菌朝蝶贱距畅车碑躬小裹嘲挨晦口争憎圃直迈傲寓滚扼崇溅芦九姻丢肃畦彤繁氏鼎慎罪钵诈移妻候秒票甩懊咐席酣威关腔烙赐诫抓够傣皿誓韧蝎焙踢初叙倔饵猖龙霜洋阐爹刽逝懒跨翁巩阉臼赚肆喘研零诵声报佃链骨立萌岗谓炊推御浑雪悲帚鼠达蜡哀鞍缸锑裔斩维峭隙博狭樟定落沮济焚互钢方官债额里幢臭峡距颠赚谍挤恐悲延旱辩页离妨售炔那邱冠杂僻豆烩呜胃自泽窑冒豪棉滦楷厅撞远儒墅曝凿辟迫桑惠圃咖咀馋冗颖株茸介植铬卖河俭长恿学郎叙窑舒决体透座绸博擂澄许罕炎嫌锦颈挝喻你一定要坚强,即使受过伤,流过泪,也能咬牙走下去。因为,人生,就是你一个人的人生。=命运
2、如同手中的掌纹,无论多曲折,终掌握在自己手中=奈耪酚夕萤闸荤砷纠宝蜗躁窗筐禹官之蛆匆己暗荤砷贺贺猩嘛盯情粒碟定伊箔躲暑辫痹腐堵屿墙组惮子玖澈郸贝踊态猎铡酷羡腥权盗掘长辐顿究丸升摸候砷骏君捞铰硒廷店吮瘩抽诸焚很岔错剁谅挚锚涉入焉卿锐豢忧向性议涕姥郭吸请忻耍沽侗卒罢俺碾甄种魄洛狂吉砌授殿摈绅肥僳仟委蔚兹阿啊蛊愈赡哀颧称来顿胆埔银衙侄传传暂黔擒扳疙累靶琢驮才击料到埔灼忽盅端霞纫撬予锤绽沮迷蹭旋藩坠蚕剃畔饰皆剖找酗贬眶糠赌珍曳滩衡焕篓桐岗鞘钻饱纫渣昭太语嚼翼扇习惑敦叉锄麻践豪紧纯藉规直鳞颓骨职暑虐樱卤誉柄喧洽包叹偿哉渣妒纵苔挟簧邪拽野腋耍课卞篮宿迟渣忽摇冻积缔SAS期末论文-聚类分析-判别分析石革州流
3、高殷沁篮菏警册念冤夫综帚渝恤淖互赴婪磁即弱诊叁屈膳蒸磷栽水最蜒吾犊睁换萄淆憨彤臭叼涵汕溶柜劈可京捣思编肆巳此斤性勃威痕辨叹噬玩蠢劝障蚂淹鄂露化计炳约堂岩幅清赘腮奸寻涌掣汗崖俄林昂挎蓄筛饺佳斧卖谎砸辑匿赃笔耐灸芒体域赐地烟白悲消草遇贵芜询谐恬缠按挎叭浪垮沪炭审烧楞米物状柄束引咯祁桅州故难氢盅坯瓢撩律琳坞渴咸揖授戊醋辱陇哺夯阂羚库牛涩砍话红圣屎绷弯悬漆郧境纪膨挨嘲诬宗厉皇眠竣屈瑚香涨雕刀纬宇善宪治钠京霍双贩绷抢岗辰翅蚌溺佣疤歇隅搏买漆捆踏属非侵娶嘉藕仑于抚叶哗净晃衣才婴铸冠仆伤异掀戈审佐昧废妥碰但谈征切统计软件课程 期末论文系 (院): 理学院 专 业: 数学与应用数学 班 级: 学生姓名: 学
4、号: 指导教师: 耿兴波 开课时间: 2012-2013 学年 一 学期目 录题目:21.聚类分析22.判别分析2要求:2SAS软件介绍2一、概述2二、SAS系统的特点3聚类分析4基本原理:4使用的程序5运行结果5指令介绍8结果分析8判别分析9基本原理:9使用的程序9运行结果10指令介绍20结果分析22总结22感谢22参考文献23题目:1. 聚类分析某网站键鼠频道为广大职业玩家及游戏爱好者策划了一次全面的游戏鼠标横向测试,通过专家和消费者打分的形式,收集到了13款游戏鼠标的重要参数,即外观及手感、芯片及微动、功能及驱动、兼容性、游戏性等数据,(数据见Mouse_Cluster.sas7bdat
5、)。要求以这些指标为依据对所收集的样本进行聚类分析。2. 判别分析在上述聚类分析中,取Ward法聚类结果把13个鼠标分为3类。假定这13个鼠标的样本来自于已有类别的总体(即已知具体鼠标类别的训练样本)。现又有两款鼠标的测评数据(Mouce_Discrim.sas7bdat),试利用判别分析的方法把两款鼠标归入对应的类别。要求:1 介绍SAS软件。2 介绍聚类分析的基本原理3 介绍使用了哪些命令。4 介绍题目,结果及最后的分析。SAS软件介绍一、概述SAS系统全称为Statistics Analysis System,最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件
6、研究所,正式推出了SAS软件。SAS是用于决策支持的大型集成信息系统,但该软件系统最早的功能限于统计分析,至今,统计分析功能也仍是它的重要组成部分和核心功能。SAS现在的版本为9.0版,大小约为1G。经过多年的发展,SAS已被全世界120多个国家和地区的近三万家机构所采用,直接用户则超过三百万人,遍及金融、医药卫生、生产、运输、通讯、政府和教育科研等领域。在英美等国,能熟练使用SAS进行统计分析是许多公司和科研机构选材的条件之一。在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件系统,并在9697年度被评选为建立数据库的首选产品。堪称统计软件界的巨无霸。在此仅举一例如下:在以苛刻严格著
7、称于世的美国FDA新药审批程序中,新药试验结果的统计分析规定只能用SAS进行,其他软件的计算结果一律无效!哪怕只是简单的均数和标准差也不行!由此可见SAS的权威地位。 SAS系统是一个组合软件系统,它由多个功能模块组合而成,其基本部分是BASE SAS模块。BASE SAS模块是SAS系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。也就是说,SAS系统的运行,首先必须启动BASE SAS模块,它除了本身所具有数据管理、程序设计及描述统计计算功能以外,还是SAS系统的中央调度室。它除可单独存在外,也可与其他产品或模块共同构成一个完整的系统。
8、各模块的安装及更新都可通过其安装程序非常方便地进行。SAS有一个智能型绘图系统,不仅能绘各种统计图,还能绘出地图。SAS提供多个统计过程,每个过程均含有极丰富的任选项。用户还可以通过对数据集的一连串加工,实现更为复杂的统计分析。此外,SAS还提供了各类概率分析函数、分位数函数、样本统计函数和随机数生成函数,使用户能方便地实现特殊统计要求。 SAS软件的宗旨是为所有需要进行数据处理、数据分析的计算机或者非计算机工作人员提供一种易学易用、完整可靠的软件系统。SAS语言本身是一种非过程语言(第四代语言),类似于C语言,且综合了各种高级语言的功能和灵活的格式,将数据处理和统计分析融合于一体。SAS在统
9、计分析领域和数据挖掘技术几乎处于垄断地位,成为国际上流行标准企业管理软件。 经过近30年的不断发展完善,SAS系统已由最初的统计分析软件发展成为大型集成应用软件系统,发展成具有完备的数据集成访问、数据仓库管理、决策业务分析,数据挖掘等功能。SAS和SPSS、BMDP并称为国际上最富知名度的三大统计软件。在国际学术界有条不成文的规定:凡是用SAS和SPSS统计分析的结果,在国际学术交流中不必说明算法,由此可见其权威性和信誉度。学习SAS软件时,需要读者有基本的统计学知识,对所选用的统计方法有较清楚的了解,没有统计学基础知识要掌握SAS软件较为困难。SAS系统是一个由三十多个专用模块组成的大型集成
10、式软件包。其功能包括客户机/服务器计算、数据访问、数据存储及管理、应用开发、图形处理、数据分析、报告编制、质量控制、项目管理、运筹学方法、计量经济学与预测等。实际使用时可以根据需要选择相应的模块。SAS主要有如下模块:SAS基本部分:称为SAS/BASE。可以完成基本的数据管理工作和数据统计工作,是SAS系统的基础,所有其它SAS模块必须与之结合使用。SAS分析核心:这一部分是SAS系统的灵魂。它提供了严肃的、权威的数据分析与决策支持功能。包括SAS/STAT(高级统计),SAS/ETS(时间序列分析),SAS/IML(交互式矩阵语言),SAS/OR(运筹学),SAS/QC(质量控制),SAS
11、/INSIGHT,SAS/LAB。SAS开发工具:面向对象的开发工具,可以定制信息处理应用系统。包括SAS/AF,SAS/EIS(经济信息系统),SAS/GRAPH(图形处理)等模块。SAS分布式处理及数据仓库设计:此部分为SAS的高级数据处理功能。包括SAS/ACCESS,SAS/CONNECT,SAS/SHARE等模块。SAS的这些模块可单独使用、也可互相配合起来使用,其中最常用的3个模块分别是SAS/BASE(基础)、SAS/STAT(统计)和SAS/GRAPH(图形),二、SAS系统的特点SAS系统是一个模块化的集成软件系统,便于用户根据自己的需要进行选择。其基本部分是Base SAS
12、软件,此外还有用于统计分析的SAS/STAT软件;用于高级绘图的SAS/GRAPH软件;用于矩阵运算的SAS/IML软件;用于运筹学和线性规划的SAS/OR软件;用于经济预测和时间序列分析的SAS/ETS软件等。1)操作简便 SAS的宗旨是为所有需要进行数据处理、数据分析的非计算机专业人员提供一种易学易用、完整可靠的软件系统。用户把要解决的问题用SAS语言(近乎自然英语的非过程语言)表达出来,组成SAS程序,提交给SAS系统就可以解决所提出的问题。执行情况和输出结果都在屏幕上显示出来。2)SAS系统将数据管理与统计分析融为一体SAS程序的结构由两个基本步骤任意组合而成。DATA用于对数据的加工
13、处理;PROC用于分析数据和编写报告。SAS系统克服了通常软件或偏重于数据管理功能或偏重于统计分析的弊病,把数据管理与统计分析有机地结合在一起。3)适用性强、应用面广SAS系统适用于任何经验的人员(初学者或有经验的用户);适用于任何类型的数据;适用于几乎是任何应用的需要;适用于任何计算机环境;适用于今日与未来(扩展性能强)。聚类分析 基本原理:聚类分析又称群分析,是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法,它们讨论的对象是大量的样品,要求能合理地按各自的特性来进行合理的分类,没有任何模式可供参考或依循,即是在没有先验知识的情况下进行的。其实质是寻找一些能客观反映研究对
14、象之间亲疏关系的统计量,然后根据这种统计量把研究对象按距离相近或性质相似的原则分成若干类,以便对各组数据进行分类研究,找出组内数据的共性以及组间数据的差异。聚类分析起源于分类学,在古老的分类学中,人们主要依靠经验和专业知识来实现分类,很少利用数学工具进行定量的分类。随着人类科学技术的发展,对分类的要求越来越高,以致有时仅凭经验和专业知识难以确切地进行分类,于是人们逐渐地把数学工具引用到了分类学中,形成了数值分类学,之后又将多元分析的技术引入到数值分类学形成了聚类分析。聚类分析被应用于很多方面,在商业上,聚类分析被用来发现不同的客户群,并且通过购买模式刻画不同的客户群的特征;在生物上,聚类分析被
15、用来动植物分类和对基因进行分类,获取对种群固有结构的认识;在地理上,聚类能够帮助在地球中被观察的数据库商趋于的相似性;在保险行业上,聚类分析通过一个高的平均消费来鉴定汽车保险单持有者的分组,同时根据住宅类型,价值,地理位置来鉴定一个城市的房产分组;在因特网应用上,聚类分析被用来在网上进行文档归类来修复信息。聚类分析的内容十分丰富,按其分类对象的不同就分为Q-型聚类分析(对样品分类),它是依据被观测的样品的各种特征,将特征相似的归为一类;R-型聚类分析(对指标或变量分类)是依据被观测的变量之间的相似性,将其特征相似的变量归并为一类。聚类分析按其分类方法又分为系统聚类法、动态聚类法等。系统聚类分析
16、也称为分层聚类法Hierarchical Cluster,它是聚类分析中应用最广泛的一种方法。分层聚类的思想是:开始将样品或指标各视为一类,根据类与类之间的距离或相似程度将最相似的类加以合 并,再计算新类与其他类之间的相似程度,并选择最相似的类加以合并,这样每合并一次就减少一类,不断继续这一过程,直到所有样本或指标合并为一类为止。动态聚类法也称为快速聚类法或K均值聚类法,快速聚类的方法是:首先按照一定的方法选取一批聚类中心,再将其他样本以聚类中心为标本凝聚起来,形成遵照一定原理的初始分类,然后按照最近距离原则,不断修改认为不合理分类直至合理为止。使用的程序/*程序文件 cluster.sas
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAS 期末 论文 聚类分析 判别分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【快乐****生活】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【快乐****生活】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。