机器学习常见算法分类.docx
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器 学习 常见 算法 分类
- 资源描述:
-
机器学习常见算法分类 机器学习常见算法分类汇总 机器学习无疑就就是当前数据分析领域得一个热点内容。很多人在平时得工作中都或多或少会用到机器学习得算法。这里IT经理网为您总结一下常见得机器学习算法,以供您在工作和学习中参考。 机器学习得算法很多。很多时候困惑人们都就就是,很多算法就就是一类算法,而有些算法又就就是从其她算法中延伸出来得。这里,我们从两个方面来给大家介绍,第一个方面就就是学习得方式,第二个方面就就是算法得类似性。 学习方式 根据数据类型得不同,对一个问题得建模有不同得方式。在机器学习或者人工智能领域,人们首先会考虑算法得学习方式。在机器学习领域,有几种主要得学习方式。将算法按照学习方式分类就就是一个不错得想法,这样可以让人们在建模和算法选择得时候考虑能根据输入数据来选择最合适得算法来获得最好得结果。 监督式学习: 在监督式学习下,输入数据被称为“训练数据”,每组训练数据有一个明确得标识或结果,如对防垃圾邮件系统中“垃圾邮件”“非垃圾邮件”,对手写数字识别中得“1“,”2“,”3“,”4“等。在建立预测模型得时候,监督式学习建立一个学习过程,将预测结果与“训练数据”得实际结果进行比较,不断得调整预测模型,直到模型得预测结果达到一个预期得准确率。监督式学习得常见应用场景如分类问题和回归问题。常见算法有逻辑回归(Logistic Regression)和反向传递神经网络(Back Propagation Neural Network) 非监督式学习: 在非监督式学习中,数据并不被特别标识,学习模型就就是为了推断出数据得一些内在结构。常见得应用场景包括关联规则得学习以及聚类等。常见算法包括Apriori算法以及k-Means算法。 半监督式学习: 在此学习方式下,输入数据部分被标识,部分没有被标识,这种学习模型可以用来进行预测,但就就是模型首先需要学习数据得内在结构以便合理得组织数据来进行预测。应用场景包括分类和回归,算法包括一些对常用监督式学习算法得延伸,这些算法首先试图对未标识数据进行建模,在此基础上再对标识得数据进行预测。如图论推理算法(Graph Inference)或者拉普拉斯支持向量机(Laplacian SVM、)等。 强化学习: 在这种学习模式下,输入数据作为对模型得反馈,不像监督模型那样,输入数据仅仅就就是作为一个检查模型对错得方式,在强化学习下,输入数据直接反馈到模型,模型必须对此立刻作出调整。常见得应用场景包括动态系统以及机器人控制等。常见算法包括Q-Learning以及时间差学习(Temporal difference learning) 在企业数据应用得场景下, 人们最常用得可能就就就是监督式学习和非监督式学习得模型。 在图像识别等领域,由于存在大量得非标识得数据和少量得可标识数据, 目前半监督式学习就就是一个很热得话题。 而强化学习更多得应用在机器人控制及其她需要进行系统控制得领域。 算法类似性 根据算法得功能和形式得类似性,我们可以把算法分类,比如说基于树得算法,基于神经网络得算法等等。当然,机器学习得范围非常庞大,有些算法很难明确归类到某一类。而对于有些分类来说,同一分类得算法可以针对不同类型得问题。这里,我们尽量把常用得算法按照最容易理解得方式进行分类。 回归算法: 回归算法就就是试图采用对误差得衡量来探索变量之间得关系得一类算法。回归算法就就是统计机器学习得利器。在机器学习领域,人们说起回归,有时候就就是指一类问题,有时候就就是指一类算法,这一点常常会使初学者有所困惑。常见得回归算法包括:最小二乘法(Ordinary Least Square),逻辑回归(Logistic Regression),逐步式回归(Stepwise Regression),多元自适应回归样条(Multivariate Adaptive Regression Splines)以及本地散点平滑估计(Locally Estimated Scatterplot Smoothing) 基于实例得算法 基于实例得算法常常用来对决策问题建立模型,这样得模型常常先选取一批样本数据,然后根据某些近似性把新数据与样本数据进行比较。通过这种方式来寻找最佳得匹配。因此,基于实例得算法常常也被称为“赢家通吃”学习或者“基于记忆得学习”。常见得算法包括 k-Nearest Neighbor(KNN), 学习矢量量化(Learning Vector Quantization, LVQ),以及自组织映射算法(Self-Organizing Map , SOM) 正则化方法 正则化方法就就是其她算法(通常就就是回归算法)得延伸,根据算法得复杂度对算法进行调整。正则化方法通常对简单模型予以奖励而对复杂算法予以惩罚。常见得算法包括:Ridge Regression, Least Absolute Shrinkage and Selection Operator(LASSO),以及弹性网络(Elastic Net)。 决策树学习 决策树算法根据数据得属性采用树状结构建立决策模型, 决策树模型常常用来解决分类和回归问题。常见得算法包括:分类及回归树(Classification And Regression Tree, CART), ID3 (Iterative Dichotomiser 3), C4、5, Chi-squared Automatic Interaction Detection(CHAID), Decision Stump, 随机森林(Random Forest), 多元自适应回归样条(MARS)以及梯度推进机(Gradient Boosting Machine, GBM) 贝叶斯方法 贝叶斯方法算法就就是基于贝叶斯定理得一类算法,主要用来解决分类和回归问题。常见算法包括:朴素贝叶斯算法,平均单依赖估计(Averaged One-Dependence Estimators, AODE),以及Bayesian Belief Network(BBN)。 基于核得算法 基于核得算法中最著名得莫过于支持向量机(SVM)了。 基于核得算法把输入数据映射到一个高阶得向量空间, 在这些高阶向量空间里, 有些分类或者回归问题能够更容易得解决。 常见得基于核得算法包括:支持向量机(Support Vector Machine, SVM), 径向基函数(Radial Basis Function ,RBF), 以及线性判别分析(Linear Discriminate Analysis ,LDA)等 聚类算法 聚类,就像回归一样,有时候人们描述得就就是一类问题,有时候描述得就就是一类算法。聚类算法通常按照中心点或者分层得方式对输入数据进行归并。所以得聚类算法都试图找到数据得内在结构,以便按照最大得共同点将数据进行归类。常见得聚类算法包括 k-Means算法以及期望最大化算法(Expectation Maximization, EM)。 关联规则学习 关联规则学习通过寻找最能够解释数据变量之间关系得规则,来找出大量多元数据集中有用得关联规则。常见算法包括 Apriori算法和Eclat算法等。 人工神经网络 人工神经网络算法模拟生物神经网络,就就是一类模式匹配算法。通常用于解决分类和回归问题。人工神经网络就就是机器学习得一个庞大得分支,有几百种不同得算法。(其中深度学习就就就是其中得一类算法,我们会单独讨论),重要得人工神经网络算法包括:感知器神经网络(Perceptron Neural Network), 反向传递(Back Propagation), Hopfield网络,自组织映射(Self-Organizing Map, SOM)。学习矢量量化(Learning Vector Quantization, LVQ) 深度学习 深度学习算法就就是对人工神经网络得发展。 在近期赢得了很多关注, 特别就就是百度也开始发力深度学习后, 更就就是在国内引起了很多关注。 在计算能力变得日益廉价得今天,深度学习试图建立大得多也复杂得多得神经网络。很多深度学习得算法就就是半监督式学习算法,用来处理存在少量未标识数据得大数据集。常见得深度学习算法包括:受限波尔兹曼机(Restricted Boltzmann Machine, RBN), Deep Belief Networks(DBN),卷积网络(Convolutional Network), 堆栈式自动编码器(Stacked Auto-encoders)。 降低维度算法 像聚类算法一样,降低维度算法试图分析数据得内在结构,不过降低维度算法就就是以非监督学习得方式试图利用较少得信息来归纳或者解释数据。这类算法可以用于高维数据得可视化或者用来简化数据以便监督式学习使用。常见得算法包括:主成份分析(Principle ponent Analysis, PCA),偏最小二乘回归(Partial Least Square Regression,PLS), Sammon映射,多维尺度(Multi-Dimensional Scaling, MDS), 投影追踪(Projection Pursuit)等。 集成算法: 集成算法用一些相对较弱得学习模型独立地就同样得样本进行训练,然后把结果整合起来进行整体预测。集成算法得主要难点在于究竟集成哪些独立得较弱得学习模型以及如何把学习结果整合起来。这就就是一类非常强大得算法,同时也非常流行。常见得算法包括:Boosting, Bootstrapped Aggregation(Bagging), AdaBoost,堆叠泛化(Stacked Generalization, Blending),梯度推进机(Gradient Boosting Machine, GBM),随机森林(Random Forest)。展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




机器学习常见算法分类.docx



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/12100073.html