分销赏收藏举报申诉 / 27

立即下载开通VIP

当前位置：首页 > 学术论文 > 论文指导/设计 > 机器学习在高熵电催化材料中的研究进展.pdf

机器学习在高熵电催化材料中的研究进展.pdf

上传人：自信****多点

文档编号：1979976

上传时间：2024-05-13

格式：PDF

页数：27

大小：5.83MB

《机器学习在高熵电催化材料中的研究进展.pdf》由会员分享，可在线阅读，更多相关《机器学习在高熵电催化材料中的研究进展.pdf（27页珍藏版）》请在咨信网上搜索。

1、第 29 卷第 5 期2023 年 10 月（自然科学版）JOURNAL OF SHANGHAI UNIVERSITY(NATURAL SCIENCE EDITION)Vol.29 No.5Oct.2023DOI:10.12066/j.issn.1007-2861.2528先进电化学能源材料与器件机器学习在高熵电催化材料中的研究进展宗宇杨1,李俊辉1,朱向东1,单光存2,马汝广1(1.苏州科技大学材料科学与工程学院,江苏苏州 215009;2.北京航空航天大学仪器光电工程学院,北京 100191)摘摘摘要要要:高熵材料(high-entropy material,HEM)是一类具有良好

2、性能的新型材料,以其较好的催化潜力、耐腐蚀性能等特点受到广泛关注.传统的高熵催化剂研究大多局限于各自的知识体系,难以兼容合并,不利于更优异的催化剂的后续研发.机器学习(machine learning,ML)作为一种基于大数据集来建立数理模型、进行研究推理的新兴学科,正逐步成为人们重点关注的人工智能科学分支.通过机器学习建立大数据库可以有效改善传统的研究状况,使研究效率大为提高.机器学习能用于识别定量的组分-结构-性能关系,通过从历史数据中学习而无需通过显式编程来加速电催化剂的设计.对机器学习算法、高熵材料进行了介绍,并阐述了机器学习在设计高熵电催化剂中的应用,讨论了机器学习在高熵电催化剂筛选

3、和预测方面的发展前景.关关关键键键词词词:电催化;高熵材料;机器学习中中中图图图分分分类类类号号号:O 646.54文文文献献献标标标志志志码码码:A文文文章章章编编编号号号:1007-2861(2023)05-0859-27Advances on machine learning used for high-entropyelectrocatalystsZONG Yuyang1,LI Junhui1,ZHU Xiangdong1,SHAN Guangcun2,MA Ruguang1(1.School of Materials Science and Engineering,Suzhou Un

4、iversity of Science and Technology,Suzhou 215009,Jiangsu,China;2.School of Instrumentation and Optoelectronic Engineering,Beihang University,Beijing 100191,China)Abstract:As a new class of materials with excellent properties,high-entropy materials(HEMs)have attracted wide interests,in the scientific

5、 community owing to their excel-lent catalytic potential and corrosion resistance.Most traditional studies on high-entropycatalysts are carried out independently,based on existing knowledge systems,which areincompatible and cannot be merged.This has hindered subsequent research and develop-ment of b

6、etter catalysts.Machine learning(ML),as a new strategy to establish mathe-matical models and conduct research and reasoning based on large data sets,is graduallybecoming a branch of artificial intelligence science.The establishment of large databasesthrough ML can effectively transform the tradition

7、al research landscape and considerably收稿日期:2023-05-03基金项目:国家自然科学基金面上资助项目(52172058)通信作者:马汝广(1983),男,教授,博士,研究方向为电化学能源存储与转化材料等.E-mail:860（自然科学版）第 29 卷improve research efficiency.ML can be employed to identify quantitative composition-structure-performance relationships,providing a novel approach to acc

8、elerate the designof electrocatalysts by learning from historical data without explicit programming.Thisreview introduces ML algorithms and HEMs,and it describes and analyses the applicationof ML in the design of high-entropy electrocatalysts.Finally,the prospects of ML in thescreening and predictio

9、n of electrocatalysts are discussed and summarised.Key words:electrocatalysis;high-entropy material(HEM);machine learning(ML)20 世纪 70 年代末 80 年代初,Cantor 等1和 Yeh 等2分别突破了主元概念的传统界限,研发了高熵合金(high-entropy alloy,HEA),也称为多主元合金(multi-principal componentalloy,MPEA).除了金属体系,研究人员还开发了高熵陶瓷(high-entropy ceramic,HEC)

10、,包括高熵金属硼化物、高熵碳化物、高熵硫化物、高熵氧化物、高熵氟化物和高熵铝硅化物等.这类含有 5 种及以上元素,并以等摩尔或近摩尔比相互固溶而得到的具有单一相的材料,统称为高熵材料(high-entropy material,HEM)3.高熵材料的设计策略强调所有参与元素集中在一起,没有明显的基础元素,通过各种元素的协同作用形成较好的整体性能4.高熵材料具有独特的 4 种效应:高熵效应、晶格畸变效应、迟滞扩散效应和鸡尾酒效应(见图 1).高熵材料不仅具有成为结构材料的强度和稳定性,也有作为功能材料的良好性能,在储能和催化领域具有较大的应用潜力5.?图 1 高熵材料的 4 种效应Fig.1 F

11、our effects of high-entropy materials高熵材料的组成灵活性允许材料性能的微调,而高熵混合提供了工作条件下的结构稳定性.例如,最先引起关注的高熵合金与传统合金相比,具有较好的机械性能、热力学稳定性、电磁特性以及催化活性等.Qin 等6总结了几种高熵合金的合成与应用,指出高熵合金具有降低电催化剂中贵金属用量的效用.因此,高熵材料作为替代贵金属电催化剂的候选材料,在能源储存与转化方面具有较好的前景.不可否认,高熵材料作为电催化剂也存在一些缺点,如较低的比表面积限制了其活性位点的暴露7,且高熵材料作为电催化剂的活性机制尚不清楚,需要进一步详细研究8.高熵材料的多组分

12、特征和多种组合可能性,使研究人员很少再利用传统方法进行研发.同时,高熵电催化材料的活性位点较复杂,为揭示材料的组分-结构-性能关系也带来了较大挑战9-10.随着计算机硬件和算法的发展,机器学习(machine learning,ML)成功地完成了分类、回归、聚类和降维任务,在大数据归纳、图像和语音识别分类、日常的电子邮件过滤方面都表现出了超强的能力11.机器学习作为处理复杂数据的强大工具也引起了材料科学领域的第 5 期宗宇杨,等:机器学习在高熵电催化材料中的研究进展861研究人员的密切关注12-14.基于材料数据库,机器学习针对特定材料属性建立模型,快速实现对材料性能的预测,有望加速新材料设计

13、进程,缩短材料研发周期15-17.本工作主要关注机器学习在高熵电催化材料设计方面的最新进展,挖掘高熵材料性能与组分、结构等因素之间的关联,寻找具有物理意义的描述符,为材料设计提供参考和指导.1机器学习1.1机器学习的定义机器学习在 Mitchell 等18的书中被定义为利用经验改善系统自身的性能,是一种针对特定的任务目标(target)来学习经验(experience)、提升性能(performance)的算法.机器学习涉及概率论、统计学、近似理论和诸多复杂算法,依靠对大量数据进行分析并将现有内容进行知识结构划分,进而高效率地得到预测结果19.近年来,研究人员研发的机器学习方法种类繁多,考虑强

14、调因素可以有不同的分类方法.目前,主流的分类偏向强调模型的学习方式,将机器学习分为如下 3 种.(1)监督学习(任务驱动型).输入数据中有标签信号,以概率函数、代数函数或人工神经网络为基函数模型,主要采用迭代计算方法在带标注训练集中进行学习,如决策树(decisiontrees)、支持向量机(support vector machine,SVM)、集成方法(ensemble method)、朴素贝叶斯分类(Naive Bayes classification)、普通最小二乘回归(ordinary least square regression)、逻辑回归(logistic regression

15、).(2)无监督学习(数据驱动型).输入数据中无标签信号,主要采用聚类与降维 2 种方法,寻找未标注数据中隐含结构,如聚类(clustering)、主成分分析(principal component analysis,PCA)、奇异值分解(singular value decomposition)、独立成分分析(independent componentanalysis).(3)强化学习(从错误中学习).以奖/惩信号或环境反馈为输入,偏重于智能体与环境交互的一种学习方法,如著名的 AlphaGo20,在没有任何先验数据的情况下,通过接收环境反馈来获取学习信息并更新模型参数.1.2材料领域中常用

16、的机器学习算法1.2.1线性回归算法线性回归(linear regression,LR)算法是机器学习中最基础的一类监督学习模型.LR 需要处理的一类问题为给定一组输入样本和每个样本对应的值,在要求的误差范围内找出目标值和输入值之间的函数关系,以便于预测任意样本的目标值21.一般形式如下:yi=0+1xi1+2xi2+mxim,i=1,2,n,(1)式中:xij|1 6 i 6 n,1 6 j 6 m 是输入样本,yi|1 6 i 6 n 是样本对应的值.而系数向量=(0,1,m)可以通过许多方法求得,如使用最小二乘法对数据集的均方根误差(rootmean square error,RMSE)

17、RMSE=s1nnPi=1(yi b yi)2!进行限制而求出.1.2.2支持向量回归算法支持向量回归(support vector regression,SVR)算法作为 SVM 算法的一个分支从而被提出.SVR 本质上是利用核函数将低维数据映射到高维,然后求解凸二次规划的最优化问题22.SVR 与 SVM 的区别在于前者主要应用于回归问题,后者主要应用于分类问题.SVR是一种二分类模型,先在线性函数 f(x)两侧制造间距为 (也叫容忍偏差,为人工设定的经验值)的间隔带,然后通过最小化总损失和最大化间隔来得出优化后的模型(见图 2(a).862（自然科学版）第 29 卷SVR 的一般形式如下

18、:f(x)=wTx+b.(2)式中:x 为样本;w 为权重;b 为偏置.SVR 对所有落入间隔带内的样本点不计算损失,即只有支持向量才会对函数模型产生影响.每个样本点的损失函数如下:l(xi,yi)=(0,if|f(xi)yi|6,|f(xi)yi|,其他,(3)因此 SVR 的优化目标函数可表示为minw,b12kwk2+CnXi=1l(xi,yi),(4)式中:第 1 项为函数 f(x)与 f(x)+的几何距离的倒数;第 2 项为模型的总损失;C 为修正系数,即在间隔带上加入损失,允许间隔带外存在点,但这些点带来的损失应尽可能小.在现实任务中往往很难直接确定合适的,以确保大部分数据都能在间

19、隔带内.这时可以加入松弛变量,使函数的间隔要求变的宽松,将部分在间隔带外的点视为在间隔带内.1.2.3深度学习算法(以深度神经网络为例)深度神经网络(deep neural network,DNN)是深度学习算法中的重要基本模型23.DNN是一类多层全连接的神经网络,其大致结构是由一个输入层(input layer)、多个隐藏层(hiddenlayer)和一个输出层(output layer)组成,其中每一层的各个节点都连接到下一层中的各个其他节点.根据实际问题的需求可以通过不断增加隐藏层的数量,使网络变得更深.DNN 也是目前十分先进的一类机器学习模型,可以模拟许多复杂的问题.DNN 是基于

20、感知机的扩展,故有时也将其称为多层感知机(multi-layer perception).感知机是一个输入若干样本、输出一个值的模型(见图 2(b).Oxyf(x)+f(x)f(x)x1x2x3(d)?DNN?(a)SVR?(b)?(c)?DNN?图 2 常用的机器学习算法Fig.2 Common machine learning algorithms第 5 期宗宇杨,等:机器学习在高熵电催化材料中的研究进展863输入和输出之间通过构建线性关系,得到中间输出结果:z=nXi=1wixi+b,(5)接着通过一个神经元激活函数sign(z)=(1,z 0(6)得到想要的结果 1 或者 1.该模型只

21、能用于二元分类,且无法学习比较复杂的非线性模型,因此在工业界无法广泛应用.而 DNN 则在此基础上做了扩展,可概括为如下 3 点.(1)加入了隐藏层.隐藏层可以有多层,以增强模型的表达能力(见图 2(c).(2)增加输出层神经元的数量.输出层的神经元可以有多个输出,这样模型便可以灵活地应用于分类回归,或其他机器学习领域,如降维、聚类等(见图 2(d).(3)对激活函数进行扩展.感知机的激活函数 sign(z)虽然简单但是处理能力极其有限,因此 DNN 中一般使用其他的激活函数,如在 Logistic 回归中使用 Sigmoid 函数:f(x)=11+ex,(7)通过使用不同的激活函数,进一步增

22、强 DNN 的表达能力.1.2.4随机森林模型随机森林(random forest,RF)是一种比较新的机器学习模型.Breiman24提出了分类树算法,通过反复二分数据进行分类或回归,大大降低计算量.2001 年 Breiman 把分类树组合成 RF,即在变量(列)和数据(行)的使用上进行随机化,生成很多分类树,再汇总分类树结果.RF 在运算量没有显著增加的前提下提高了预测精度.RF 对多元共线性不敏感,结果对缺失数据和非平衡数据比较稳健,可以较好地预测多达几千个解释变量,被誉为当前最好的算法之一.RF 大致由如下 3 个部分组成.(1)数据随机选取.RF 通过自扩展(bootstrap)采

23、样法,从原始训练样本集 N 中有放回地重复随机抽取 k 个样本生成新的训练样本集,并由此构建 k 个决策树分类器.当 N 充分大时,训练集中每个样本未被抽中的概率将收敛于 36.8%,即原始数据中约有 36.8%的样本不会出现在 Bootstrap 样本中,这些数据被称为袋外数据,可用来对模型的误差进行估计.(2)分枝方法的选取.分枝优度准则是基于离均差平方和(SS=P(xi x)2).假设有 n个自变量 X=(x1,x2,xn)和连续性因变量 Y.对于决策树某一节点 t 的样本量 N(t)可以计算该节点的 SS.假定该节点所有的分枝集合为 A,A 中的任意元素(分枝)可以将节点 t分为 2

24、个子节点,记为 Lt和 Rt.最佳分枝即是使分枝前后的 SS 相差最大的分枝,即分裂后效果优于分裂前,使各子节点内的变异最小.(3)待选特征随机选取.与数据集的选取相同,子决策树的每一分裂过程并未用到所有待选择的特征,而是从所有待选特征中随机选取一定数量的特征,然后在选中的特征中挑出最优特征.这样,就最大程度地保证每一颗决策树的不同,提升系统多样性,从而提高性能.在寻找最佳分类特征和阈值时目标函数为argmax(Gini Ginileft Giniright),(8)864（自然科学版）第 29 卷式中:Gini 为基尼指数,用来表示节点纯度,Gini 越大则纯度越低.如果属性被分为 n 类,

25、第 i类在当前节点数据集中的占比为 p(i),那么基尼指数的计算方法为Gini=1 nXi=1p(i)2,(9)故寻找最佳分类的评判标准可以理解为寻找最佳特征 f,使得当前节点的 Gini 值减去左子节点 Gini 值和右子节点 Gini 值最大.1.3机器学习在材料科学中的应用1.3.1材料数据库的建立随着材料基因组概念的不断深化,全面准确地表征材料组分-结构-性能间的关系是研究和开发新材料的关键,特别是对于具有庞大排列组合的高熵材料催化剂.通过数据库可以高精度地建立模型,预测未知催化剂的催化性能,了解结构-性能关系,再使用合适的通用描述符,可以准确、全面地表示催化剂的结构信息.同时,一个有

26、效的描述符可以加速大数据模型的发展,揭示催化过程的基本物理性质,掌握材料的本质特征,更好地应用甚至实现真正的材料按需设计25-26.目前,已有的研究虽然还处于依靠有限的数据进行探索的阶段,但是也证明了数据驱动型材料科学的研究是非常有效的.随着全世界对材料学数据库的不断重视、整合和完善,越来越多的数据资源可供使用,许多不同类型的材料数据(如物理、化学、机械、电子和热力学)都可以由包括以量子力学为基础的密度泛函理论(density functional theory,DFT)、Hatree-Fork方法或实验测量(如电导率、离子导率)生成27-28.如此大的数据为数据驱动技术或机器学习方法的应用提

27、供了机会,从而加速新的先进材料的发现和设计.不过,许多包含大量材料结构和特性的公开数据库,如 Materials Project、The Inorganic Crystal Structure Database(ICSD)等,主要是由有序或简单的结构构建的,对于一个包含化学无序的高熵物质,目前这些数据库仍然是不可通用.高熵材料数据库的不足也可以部分归因于其首次发现的时间较短.1.3.2材料设计的模型算法当前,计算机辅助分子设计(computer aided molecular design,CAMD)方法被提出并得到了显著发展,其目的是合理地选择或设计具有指定特性的分子.CAMD 方法自出现以

28、来,已被用于设计溶剂、药品和消费品、工作流体、聚合物、制冷剂和过渡金属催化剂等29.与CAMD 问题类似,材料的设计任务可以如下定义:给定一个从实验和(或)第一性原理计算获得的数据集,确定具有最佳特性的材料结构和成分.对于材料设计,关键的步骤是建立一个相关模型.该模型可以基于给定的数据集材料性质,准确描述输入的特定材料的特征(通常为结构特征)与感兴趣的特性之间的关系.经典模型的构建在很大程度上依赖于物理观点和机制,如使用守恒定律和热力学来从已有的参考数据中导出参数(通常为线性或拟合线性)的数学公式.机器学习则采用了不同的途径,即不再依赖原理或物理知识,而是根据现有的可用数据,以灵活且非线性

29、的形式训练模型.图 3 展示了基于机器学习的材料发现和设计的通用工作流程30,该流程包括 3 个主要步骤:描述符生成和降维、模型构建和验证、材料预测和实验验证.用 1 组描述符或特征在数据集中表示材料,需要有关材料和应用程序的特定领域知识;在 1 组参考材料的已知数据的基础上,在描述符和目标属性之间建立映射模型,从简单的线性和非线性回归到高度复杂的核岭回归和神经网络,各种机器学习方法都可以用来建立这种映射;根据所建立的机器学习模型进行反向设计,以找到具有期望性质的新材料,合成最佳的候选材料,并对其真实特性或性能进行实验验证.第 5 期宗宇杨,等:机器学习在高熵电催化材料中的研究进展865?图

30、3 基于机器学习的材料发现和设计的通用工作流程Fig.3 General workflow of materials discovery and design based on machine learning1.3.2.1描述符生成和降维对于材料设计而言,数据主要来源包括抽样测试的方法和公开的数据库.抽样测试方法即在构建数据全集后从中以某种原则进行子集抽样并对子集中的数据实施性能测试(理论计算或者实验).构建数据全集主要提取材料的特征性能,并把其抽象为描述符.通常,机器学习应用程序使用 3 种类型的特征描述符:几何、电子和活性.当性质来自于体系的几何结构时,描述符通常被称为结构描述符,包括原

31、子半径/共价半径、原子序数(即质量数)、基团数、摩尔体积、晶格常数、旋转角度、键长、配位数、活性位点和表面性质(即缺陷/微观结构/界面)31.其出发点是从催化剂的结构特征出发,构建这些属性与催化性能的关联.此外,如果这些性质是由电子密度推导出来的,则描述符被称为电子描述符32.这些描述符通常从电子结构计算中获得,即需要花费较长时间通过第一性原理计算,涉及 d 带轨道、带隙、s 带电子、电荷/电荷差、价电子等.对于过渡金属来说,主要的反应活性在于 d 带轨道,其性质包括费米能级的中心、填充、宽度、偏度、峰度和密度,过渡金属在电催化中起着至关重要的作用33.电子描述符较之于结构描述符,能够更直接地

32、体现不同催化剂与反应中间体之间相互作用程度的差异,并且其可推广性较之于结构描述符更强.另外,还有一种类型的描述符,用于描述接受或失去电子/质子/基团的能力,以表明活性,称为活性描述符,包括吸附能、电负性、电子亲和度、电离能等34.吸附能反映了基团在电催化剂表面的吸附能力,可以作为一个描述符来预测电催化的性质(如起始电位、转换频率和产物选择性).因此,在运用机器学习过程之前,识别与所关注的材料特性密切相关的关键特征或描述符始终是至关重要的步骤.此外,根据所研究的问题或性质,可以在不同的复杂度上定义描述符.Sarker 等35总结了几个先前已经被开发的重要材料描述符.最简单的描述符是一维(1D)参

33、数,如分子体积、重量和表面积、电子数量和极性.这些描述符很少包含关于材料或分子实际结构的信息.在预测某些属性时,更可取的是使用表示 2 维(2D)甚至 3 维(3D)结构的描述符.拓扑描述符考虑分子或材料的 2 维图形结构,从而反映对称性、分支和原子连通性等特征.最常用的拓扑描述符是邻接矩阵和分子连接性指数.这些描述符的局限性是不包含任何立体化学信息.一个重要的 3D 材质描述符是径向分布函数(radial distribution function,RDF)36.RDF 通常由 g(r)表示,定义了在另一个标记的粒子或原子的 r 距离处找到粒子或原子的概率,这种类型的描述866（自然科学版）

34、第 29 卷符可以从实验测量(如 X 射线测量)中获得.在当前数据库中,可用的材料数据往往彼此高度相关.因此,在构建机器学习模型之前,有必要使用尺寸缩减工具预处理高维数据集37.有几种算法可为机器学习模型减小特征空间的维度,并帮助识别最相关的描述符(或关键特征),如PCA、多维缩放(multi-dimensional scaling,MDS)和线性判别(linear discriminant analysis,LDA).例如,PCA 使用正交变换将一组相关变量转换为一组简化的不相关的新变量或主成分(principal component,PC),在选择每个 PC 时应尽量保证与其他 PC 不相

35、关,构成一个可以代表原始数据的缩小的维度空间,这样信息损失极小.1.3.2.2模型构建和验证机器学习模型的构建在材料发现和设计预测结果中起着关键作用.一个合适的模型不仅可以保证最终输出结果的可靠性,也能够大量减少训练需要花费的时间.总体而言,在材料设计中分为监督学习、无监督学习 2 大类.监督学习旨在找到一组输入数据映射到相应输出属性的函数,使用预先标记的数据来学习输出 Y 和输入 X 之间的关系,并且在必须告知 Y 的值和相应的 X 值的意义上进行监督.例如,k-最近邻(k-nearest neighbor,k-NN)算法38,其基本原理是通过特征空间中 k 个近邻的大多数来识别样本,使用投

36、票机制来处理回归和分类问题.k 值的选择以及样本与训练数据在特征空间中的距离是最需要关注的 2 个问题:k 值需要研究人员根据原始训练数据集的特征,通过交叉验证进行分配;k 值可以度量模型的复杂度,k 值越小表示模型越复杂,过拟合情况越容易发生.此外,如果使用该方法训练的数据集很大,则 k-NN 的预测非常耗时,并且内存占用也很大,训练数据的不平衡也会影响 k-NN 的性能.无监督学习则在没有任何事先指导的情况下学习数据的属性,如通过根据数据的特征将数据分组或通过在高维空间中找到数据变化的主导方向39.由于每种方法或算法都有其自身的适用性和适用范围,因此选择合适的机器学习算法对于其成功实施至关

37、重要.最小二乘回归、核岭回归、神经网络和决策树这几种算法都可以创建属性预测模型.但是,某些算法(如基于回归的算法)提供了实际的预测功能,而其他算法(如决策树)则没有.此外,可用数据的数量也决定了学习算法的选择.例如,要正确处理数十至数千个数据点,可以使用诸如克里金和核岭回归的回归方法,但是当数据比这大得多时,则需应用更复杂的学习方法,如深度神经网络.对于机器学习模型而言,不仅要求其对训练数据集有很好的拟合(训练误差),同时也希望对未知数据集(测试集)有很好的拟合结果(泛化能力),所产生的测试误差被称为泛化误差40.度量泛化能力的好坏,最直观的表现就是模型的过拟合(overfitting)和欠拟

38、合(underfitting).过拟合和欠拟合是用于描述模型在训练过程中的 2 种状态.一般来说,训练过程会是如图 4 所示的一个曲线图.?图 4 欠拟合与过拟合示意图Fig.4 Schematic diagram of underfitting and overfitting第 5 期宗宇杨,等:机器学习在高熵电催化材料中的研究进展867刚开始训练的时候,模型还在学习过程中,处于欠拟合区域(指模型不能在训练集上获得足够低的误差),此时模型复杂度低,模型在训练集上表现较差,没学习到数据背后的规律.随着训练的推进,训练误差和测试误差都下降.在到达一个临界点之后,训练集的误差下降,测试集的误差上升

39、了,这时就进入了过拟合区域(指训练误差和测试误差之间的差距太大),模型复杂度高于实际问题,模型在训练集上表现较好,但在测试集上却表现较差,泛化能力差,从而对训练集以外的数据预测不精确.综上,欠拟合基本上都会发生在训练刚开始的时候,经过不断训练后欠拟合能得到解决.如果此时还存在欠拟合,则可以通过增加网络复杂度或者在模型中增加特征,来解决欠拟合的问题.要想解决过拟合问题,就要显著减少测试误差而不过度增加训练误差,从而提高模型的泛化能力.可以使用正则化(regularization)方法41修改学习算法,使其降低泛化误差而非训练误差.常用的正则化方法根据具体使用策略的不同可分为直接提供正则化约束的参

40、数的方法,如 L1/L2 正则化;通过工程上的技巧来实现更低泛化误差的方法,如提前终止(earlystopping)和暂退法(dropout);不直接提供约束的隐式正则化方法,如数据增强等.(1)获取和使用更多的数据(数据集增强)解决过拟合的根本性方法.使机器学习或深度学习模型泛化能力更好的办法就是使用更多的数据进行训练.但是,在实践中拥有的数据量是有限的.解决这个问题的一种方法就是创建假数据并添加到训练集中数据集增强.通过增加训练集的额外副本来增加训练集的大小,进而改进模型的泛化能力.(2)采用合适的模型(控制模型的复杂度).过于复杂的模型会带来过拟合问题.对于模型的设计,目前公认的一个深度

41、学习规律是越深入越好.对于卷积神经网络(convolutional Neural Networks,CNN)来说,层数越多效果越好,但是也更容易产生过拟合,并且计算所耗费的时间也越长.而根据奥卡姆剃刀法则,应该选择简单、合适的模型解决复杂的问题.(3)降低特征的数量.对于一些特征工程而言,可以降低特征的数量,删除冗余特征,人工选择保留特征来解决过拟合问题.(4)暂退法.暂退法是在训练网络时用的一种技巧(trick),相当于在隐藏单元增加了噪声.暂退法指的是在训练过程中每次按一定的概率(比如 50%)随机地删除一部分隐藏单元(神经元).暂退法目的是在训练过程中产生不同的训练模型,这些不同的训练模

42、型也会产生不同的计算结果.随着训练的不断推进,计算结果会在一个范围内波动,但是均值却不会有很大变化,因此可以把最终的训练结果看作是不同模型的平均输出,并且消除或者减弱了神经元节点间的联合,降低了网络对单个神经元的依赖,从而增强了泛化能力.(5)提前终止.对模型进行训练的过程即是对模型的参数进行学习更新的过程,这个参数学习的过程往往会用到一些迭代方法,如梯度下降(gradient descent).提前终止是通过迭代次数截断来防止过拟合的方法,即在模型对训练数据集迭代收敛之前停止迭代来防止过拟合.为了获得性能良好的神经网络,训练过程中可能会经过很多次轮数(epoch).而提前终止就是在每个轮数(

43、或每 N 个轮数)结束后,在验证集上获取测试结果.随着轮数的增加,如果在验证集上发现测试误差上升,则停止训练,将停止之后的权重作为网络的最终参数.868（自然科学版）第 29 卷1.3.2.3材料预测和实验验证如图 3 所示,在建立机器学习模型后,可以通过交叉验证法来评估模型的稳健性和泛化性42.将大小为 k 的训练样本划分成大小为 k 1 的校准样本和大小为 1 的验证样本,重复 k次.划分验证集,对训练集生成的参数进行测试,从而相对客观地判断这些参数与训练集外数据的符合性,选择最优模型.交叉验证方法评价结果的稳定性和保真度在很大程度上取决于 k的值,因此交叉验证方法通常被称为 k-fold

44、交叉验证,其中 k 最常用的值为 5 和 10.留一交叉验证(leave-one-out cross validation,LOOCV)方法是在数据集较少的情况下交叉验证的一种特殊形式,即只使用原始训练集中的一个样本作为验证集,其余样本作为训练数据.对于小数据集的情况,另一种有用的方法是自举法(bootstrap),该方法可以通过带替换的抽样方法从初始数据集生成所需大小的训练集.然而,由自举方法生成的数据集的分布与初始数据集的分布不同,这将引入估计偏差.因此,当数据量足够时,通常采用交叉验证方法.在对模型进行评价时,除了对模型的预测性能进行评价外,还应考虑模型的效率、复杂性、稳健性和可移植性

45、.当机器学习模型通过验证后可以进行反向设计以根据模型查找具有所需特性的材料.该过程通过使用大规模筛选或数学优化来完成.大规模筛选方法的基本思想是,在设计空间中生成所有可能的候选材料后使用已学习的模型逐一进行测试.通常,材料的生成必须考虑对材料的几个限制,这些限制通常以 2 种形式存在:结构和组成成分.因此,需要使用一个系统的程序来识别设计空间中的所有材料(或尽可能多的材料).在生成候选材料后,使用经过训练的模型可简单、直接地评估其属性,或者可以将反向材料设计公式转化为数学优化问题,其中目标特性在受到结构和成分约束的情况下得到优化.优化的方法试图在不测试设计空间中所有候选对象的情况下确定有前途的

46、材料,这使该方法受组合复杂度的限制要小得多.确定性或随机算法均可用于解决所确定的最优材料的成分优化问题.在确定最佳材料后,就能够合成这些材料并通过实验验证其实际性能.如果实验结果与预测结果吻合良好,则可以证明该模型对于该问题拟合预测效果良好,通过该模型可以继续探索新催化剂;如果实验结果不符合预测,可将所设计的材料及相应的实验结果添加到训练集中,并重新训练机器学习模型.2高熵材料2.1定义含有 5 种或 5 种以上的等摩尔比合金形成的单一固溶体被定义为高熵合金(high-entropyalloy,HEA)1,37,也有人认为不应该限制元素浓度43-44.此外,合金的熵可由构型熵公式来计算:Smi

47、x=RXcilnci,(10)式中:Smix为混合熵;R 为摩尔气体常数;ci为第 i 元素的摩尔分数.因此,根据合金的熵值大小,可将合金分为低熵合金(low-entropy alloy(LEA),Smix 1.0R)、中熵合金(medium-entropy alloy(MEA),1.0R Smix 1.5R).这种材料的结构无序程度将明显大于二元或三元合金,从而产生更高的熵,有更高的热力学稳定性.由式(10)得到构型熵后可以得到一系列摩尔比相等的高熵合金(见图 5(a)45.高熵化合物,也称为高熵陶瓷,通常包含了除金属元素外的其他非金属元素(如氢、氧、硫、氟等),与金属化合物框架的前驱体一起

48、,通过沉淀、加热、机械加工等各种方法形成稳定的高熵化合物,具体定义相似于高熵合金46.第 5 期宗宇杨,等:机器学习在高熵电催化材料中的研究进展8692.2特点高熵合金的晶体结构通常为简单的面心立方(face-centered cubic,FCC)结构、体心立方(body-centered cubic,BCC)结构以及密排六方(hexagonal close packed,HCP)结构,不同原子随机占据晶格位置,形成简单固溶体.目前,已报道的高熵合金纳米催化剂最常见的结构为FCC,其他结构如 BCC 和 HCP 结构,局部序度的改变会造成键长的变化从而带来结构上的特殊性(见图 5(b).另外,

49、包括活性位点的定性和定量、机理研究和催化性能的优化在内的研究都依赖于高熵材料的精确表征.由于高熵材料成分和结构的复杂性增加,故这是具有挑战性的.当然,尽管存在挑战,利用各种技术来表征高熵材料已经取得了很多进展(见图 5(c).MEAHEADiffractionSpectroscopyMicroscopyLEA3.02.52.01.51.00.50Smixcoril0246n8101214XRDXANESEXAFSXPSAESLEISSEMTEMSTEMETEMSTEM-EDSSTEM-EELSPDFChemicalstateBulkstructureSynchrotron XRDNeutron

50、 diffractionLocalstructure(b)?5?(?5?)?(a)?HEA?45(c)?HEM?47HEAsInterface formationConventional substitutionMulticomponentintermetallicsLocalclusteringSolidsolutions图 5 高熵材料的定义、结构特点和表征方法Fig.5 Definition,structure feature and characterization techniques of high-entropy matorials基于高熵合金的结构,研究人员总结出高熵合金不同于

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 机器学习电催化材料中的研究进展

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。