机器学习在高熵电催化材料中的研究进展.pdf
《机器学习在高熵电催化材料中的研究进展.pdf》由会员分享,可在线阅读,更多相关《机器学习在高熵电催化材料中的研究进展.pdf(27页珍藏版)》请在咨信网上搜索。
1、第 29 卷 第 5 期2023 年 10 月(自然科学版)JOURNAL OF SHANGHAI UNIVERSITY(NATURAL SCIENCE EDITION)Vol.29 No.5Oct.2023DOI:10.12066/j.issn.1007-2861.2528先进电化学能源材料与器件机器学习在高熵电催化材料中的研究进展宗宇杨1,李俊辉1,朱向东1,单光存2,马汝广1(1.苏州科技大学 材料科学与工程学院,江苏 苏州 215009;2.北京航空航天大学 仪器光电工程学院,北京 100191)摘摘摘要要要:高熵材料(high-entropy material,HEM)是一类具有良好
2、性能的新型材料,以其较好的催化潜力、耐腐蚀性能等特点受到广泛关注.传统的高熵催化剂研究大多局限于各自的知识体系,难以兼容合并,不利于更优异的催化剂的后续研发.机器学习(machine learning,ML)作为一种基于大数据集来建立数理模型、进行研究推理的新兴学科,正逐步成为人们重点关注的人工智能科学分支.通过机器学习建立大数据库可以有效改善传统的研究状况,使研究效率大为提高.机器学习能用于识别定量的组分-结构-性能关系,通过从历史数据中学习而无需通过显式编程来加速电催化剂的设计.对机器学习算法、高熵材料进行了介绍,并阐述了机器学习在设计高熵电催化剂中的应用,讨论了机器学习在高熵电催化剂筛选
3、和预测方面的发展前景.关关关键键键词词词:电催化;高熵材料;机器学习中中中图图图分分分类类类号号号:O 646.54文文文献献献标标标志志志码码码:A文文文章章章编编编号号号:1007-2861(2023)05-0859-27Advances on machine learning used for high-entropyelectrocatalystsZONG Yuyang1,LI Junhui1,ZHU Xiangdong1,SHAN Guangcun2,MA Ruguang1(1.School of Materials Science and Engineering,Suzhou Un
4、iversity of Science and Technology,Suzhou 215009,Jiangsu,China;2.School of Instrumentation and Optoelectronic Engineering,Beihang University,Beijing 100191,China)Abstract:As a new class of materials with excellent properties,high-entropy materials(HEMs)have attracted wide interests,in the scientific
5、 community owing to their excel-lent catalytic potential and corrosion resistance.Most traditional studies on high-entropycatalysts are carried out independently,based on existing knowledge systems,which areincompatible and cannot be merged.This has hindered subsequent research and develop-ment of b
6、etter catalysts.Machine learning(ML),as a new strategy to establish mathe-matical models and conduct research and reasoning based on large data sets,is graduallybecoming a branch of artificial intelligence science.The establishment of large databasesthrough ML can effectively transform the tradition
7、al research landscape and considerably收稿日期:2023-05-03基金项目:国家自然科学基金面上资助项目(52172058)通信作者:马汝广(1983),男,教授,博士,研究方向为电化学能源存储与转化材料等.E-mail:860(自然科学版)第 29 卷improve research efficiency.ML can be employed to identify quantitative composition-structure-performance relationships,providing a novel approach to acc
8、elerate the designof electrocatalysts by learning from historical data without explicit programming.Thisreview introduces ML algorithms and HEMs,and it describes and analyses the applicationof ML in the design of high-entropy electrocatalysts.Finally,the prospects of ML in thescreening and predictio
9、n of electrocatalysts are discussed and summarised.Key words:electrocatalysis;high-entropy material(HEM);machine learning(ML)20 世纪 70 年代末 80 年代初,Cantor 等1和 Yeh 等2分别突破了主元概念的传统界限,研发了高熵合金(high-entropy alloy,HEA),也称为多主元合金(multi-principal componentalloy,MPEA).除了金属体系,研究人员还开发了高熵陶瓷(high-entropy ceramic,HEC)
10、,包括高熵金属硼化物、高熵碳化物、高熵硫化物、高熵氧化物、高熵氟化物和高熵铝硅化物等.这类含有 5 种及以上元素,并以等摩尔或近摩尔比相互固溶而得到的具有单一相的材料,统称为高熵材料(high-entropy material,HEM)3.高熵材料的设计策略强调所有参与元素集中在一起,没有明显的基础元素,通过各种元素的协同作用形成较好的整体性能4.高熵材料具有独特的 4 种效应:高熵效应、晶格畸变效应、迟滞扩散效应和鸡尾酒效应(见图 1).高熵材料不仅具有成为结构材料的强度和稳定性,也有作为功能材料的良好性能,在储能和催化领域具有较大的应用潜力5.?图 1 高熵材料的 4 种效应Fig.1 F
11、our effects of high-entropy materials高熵材料的组成灵活性允许材料性能的微调,而高熵混合提供了工作条件下的结构稳定性.例如,最先引起关注的高熵合金与传统合金相比,具有较好的机械性能、热力学稳定性、电磁特性以及催化活性等.Qin 等6总结了几种高熵合金的合成与应用,指出高熵合金具有降低电催化剂中贵金属用量的效用.因此,高熵材料作为替代贵金属电催化剂的候选材料,在能源储存与转化方面具有较好的前景.不可否认,高熵材料作为电催化剂也存在一些缺点,如较低的比表面积限制了其活性位点的暴露7,且高熵材料作为电催化剂的活性机制尚不清楚,需要进一步详细研究8.高熵材料的多组分
12、特征和多种组合可能性,使研究人员很少再利用传统方法进行研发.同时,高熵电催化材料的活性位点较复杂,为揭示材料的组分-结构-性能关系也带来了较大挑战9-10.随着计算机硬件和算法的发展,机器学习(machine learning,ML)成功地完成了分类、回归、聚类和降维任务,在大数据归纳、图像和语音识别分类、日常的电子邮件过滤方面都表现出了超强的能力11.机器学习作为处理复杂数据的强大工具也引起了材料科学领域的第 5 期宗宇杨,等:机器学习在高熵电催化材料中的研究进展861研究人员的密切关注12-14.基于材料数据库,机器学习针对特定材料属性建立模型,快速实现对材料性能的预测,有望加速新材料设计
13、进程,缩短材料研发周期15-17.本工作主要关注机器学习在高熵电催化材料设计方面的最新进展,挖掘高熵材料性能与组分、结构等因素之间的关联,寻找具有物理意义的描述符,为材料设计提供参考和指导.1机器学习1.1机器学习的定义机器学习在 Mitchell 等18的书中被定义为利用经验改善系统自身的性能,是一种针对特定的任务目标(target)来学习经验(experience)、提升性能(performance)的算法.机器学习涉及概率论、统计学、近似理论和诸多复杂算法,依靠对大量数据进行分析并将现有内容进行知识结构划分,进而高效率地得到预测结果19.近年来,研究人员研发的机器学习方法种类繁多,考虑强
14、调因素可以有不同的分类方法.目前,主流的分类偏向强调模型的学习方式,将机器学习分为如下 3 种.(1)监督学习(任务驱动型).输入数据中有标签信号,以概率函数、代数函数或人工神经网络为基函数模型,主要采用迭代计算方法在带标注训练集中进行学习,如决策树(decisiontrees)、支持向量机(support vector machine,SVM)、集成方法(ensemble method)、朴素贝叶斯分类(Naive Bayes classification)、普通最小二乘回归(ordinary least square regression)、逻辑回归(logistic regression
15、).(2)无监督学习(数据驱动型).输入数据中无标签信号,主要采用聚类与降维 2 种方法,寻找未标注数据中隐含结构,如聚类(clustering)、主成分分析(principal component analysis,PCA)、奇异值分解(singular value decomposition)、独立成分分析(independent componentanalysis).(3)强化学习(从错误中学习).以奖/惩信号或环境反馈为输入,偏重于智能体与环境交互的一种学习方法,如著名的 AlphaGo20,在没有任何先验数据的情况下,通过接收环境反馈来获取学习信息并更新模型参数.1.2材料领域中常用
16、的机器学习算法1.2.1线性回归算法线性回归(linear regression,LR)算法是机器学习中最基础的一类监督学习模型.LR 需要处理的一类问题为给定一组输入样本和每个样本对应的值,在要求的误差范围内找出目标值和输入值之间的函数关系,以便于预测任意样本的目标值21.一般形式如下:yi=0+1xi1+2xi2+mxim,i=1,2,n,(1)式中:xij|1 6 i 6 n,1 6 j 6 m 是输入样本,yi|1 6 i 6 n 是样本对应的值.而系数向量=(0,1,m)可以通过许多方法求得,如使用最小二乘法对数据集的均方根误差(rootmean square error,RMSE)
17、RMSE=s1nnPi=1(yi b yi)2!进行限制而求出.1.2.2支持向量回归算法支持向量回归(support vector regression,SVR)算法作为 SVM 算法的一个分支从而被提出.SVR 本质上是利用核函数将低维数据映射到高维,然后求解凸二次规划的最优化问题22.SVR 与 SVM 的区别在于前者主要应用于回归问题,后者主要应用于分类问题.SVR是一种二分类模型,先在线性函数 f(x)两侧制造间距为 (也叫容忍偏差,为人工设定的经验值)的间隔带,然后通过最小化总损失和最大化间隔来得出优化后的模型(见图 2(a).862(自然科学版)第 29 卷SVR 的一般形式如下
18、:f(x)=wTx+b.(2)式中:x 为样本;w 为权重;b 为偏置.SVR 对所有落入间隔带内的样本点不计算损失,即只有支持向量才会对函数模型产生影响.每个样本点的损失函数如下:l(xi,yi)=(0,if|f(xi)yi|6,|f(xi)yi|,其他,(3)因此 SVR 的优化目标函数可表示为minw,b12kwk2+CnXi=1l(xi,yi),(4)式中:第 1 项为函数 f(x)与 f(x)+的几何距离的倒数;第 2 项为模型的总损失;C 为修正系数,即在间隔带上加入损失,允许间隔带外存在点,但这些点带来的损失应尽可能小.在现实任务中往往很难直接确定合适的,以确保大部分数据都能在间
19、隔带内.这时可以加入松弛变量,使函数的间隔要求变的宽松,将部分在间隔带外的点视为在间隔带内.1.2.3深度学习算法(以深度神经网络为例)深度神经网络(deep neural network,DNN)是深度学习算法中的重要基本模型23.DNN是一类多层全连接的神经网络,其大致结构是由一个输入层(input layer)、多个隐藏层(hiddenlayer)和一个输出层(output layer)组成,其中每一层的各个节点都连接到下一层中的各个其他节点.根据实际问题的需求可以通过不断增加隐藏层的数量,使网络变得更深.DNN 也是目前十分先进的一类机器学习模型,可以模拟许多复杂的问题.DNN 是基于
20、感知机的扩展,故有时也将其称为多层感知机(multi-layer perception).感知机是一个输入若干样本、输出一个值的模型(见图 2(b).Oxyf(x)+f(x)f(x)x1x2x3(d)?DNN?(a)SVR?(b)?(c)?DNN?图 2 常用的机器学习算法Fig.2 Common machine learning algorithms第 5 期宗宇杨,等:机器学习在高熵电催化材料中的研究进展863输入和输出之间通过构建线性关系,得到中间输出结果:z=nXi=1wixi+b,(5)接着通过一个神经元激活函数sign(z)=(1,z 0(6)得到想要的结果 1 或者 1.该模型只
21、能用于二元分类,且无法学习比较复杂的非线性模型,因此在工业界无法广泛应用.而 DNN 则在此基础上做了扩展,可概括为如下 3 点.(1)加入了隐藏层.隐藏层可以有多层,以增强模型的表达能力(见图 2(c).(2)增加输出层神经元的数量.输出层的神经元可以有多个输出,这样模型便可以灵活地应用于分类回归,或其他机器学习领域,如降维、聚类等(见图 2(d).(3)对激活函数进行扩展.感知机的激活函数 sign(z)虽然简单但是处理能力极其有限,因此 DNN 中一般使用其他的激活函数,如在 Logistic 回归中使用 Sigmoid 函数:f(x)=11+ex,(7)通过使用不同的激活函数,进一步增
22、强 DNN 的表达能力.1.2.4随机森林模型随机森林(random forest,RF)是一种比较新的机器学习模型.Breiman24提出了分类树算法,通过反复二分数据进行分类或回归,大大降低计算量.2001 年 Breiman 把分类树组合成 RF,即在变量(列)和数据(行)的使用上进行随机化,生成很多分类树,再汇总分类树结果.RF 在运算量没有显著增加的前提下提高了预测精度.RF 对多元共线性不敏感,结果对缺失数据和非平衡数据比较稳健,可以较好地预测多达几千个解释变量,被誉为当前最好的算法之一.RF 大致由如下 3 个部分组成.(1)数据随机选取.RF 通过自扩展(bootstrap)采
23、样法,从原始训练样本集 N 中有放回地重复随机抽取 k 个样本生成新的训练样本集,并由此构建 k 个决策树分类器.当 N 充分大时,训练集中每个样本未被抽中的概率将收敛于 36.8%,即原始数据中约有 36.8%的样本不会出现在 Bootstrap 样本中,这些数据被称为袋外数据,可用来对模型的误差进行估计.(2)分枝方法的选取.分枝优度准则是基于离均差平方和(SS=P(xi x)2).假设有 n个自变量 X=(x1,x2,xn)和连续性因变量 Y.对于决策树某一节点 t 的样本量 N(t)可以计算该节点的 SS.假定该节点所有的分枝集合为 A,A 中的任意元素(分枝)可以将节点 t分为 2
24、个子节点,记为 Lt和 Rt.最佳分枝即是使分枝前后的 SS 相差最大的分枝,即分裂后效果优于分裂前,使各子节点内的变异最小.(3)待选特征随机选取.与数据集的选取相同,子决策树的每一分裂过程并未用到所有待选择的特征,而是从所有待选特征中随机选取一定数量的特征,然后在选中的特征中挑出最优特征.这样,就最大程度地保证每一颗决策树的不同,提升系统多样性,从而提高性能.在寻找最佳分类特征和阈值时目标函数为argmax(Gini Ginileft Giniright),(8)864(自然科学版)第 29 卷式中:Gini 为基尼指数,用来表示节点纯度,Gini 越大则纯度越低.如果属性被分为 n 类,
25、第 i类在当前节点数据集中的占比为 p(i),那么基尼指数的计算方法为Gini=1 nXi=1p(i)2,(9)故寻找最佳分类的评判标准可以理解为寻找最佳特征 f,使得当前节点的 Gini 值减去左子节点 Gini 值和右子节点 Gini 值最大.1.3机器学习在材料科学中的应用1.3.1材料数据库的建立随着材料基因组概念的不断深化,全面准确地表征材料组分-结构-性能间的关系是研究和开发新材料的关键,特别是对于具有庞大排列组合的高熵材料催化剂.通过数据库可以高精度地建立模型,预测未知催化剂的催化性能,了解结构-性能关系,再使用合适的通用描述符,可以准确、全面地表示催化剂的结构信息.同时,一个有
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器 学习 电催化 材料 中的 研究进展
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。