GEP的来龙去脉PPT系统学习.ppt
《GEP的来龙去脉PPT系统学习.ppt》由会员分享,可在线阅读,更多相关《GEP的来龙去脉PPT系统学习.ppt(124页珍藏版)》请在咨信网上搜索。
1、2011.52011.5广西师范学院广西师范学院广西师范学院广西师范学院科学计算与智能信息处理广西高校重点实验室科学计算与智能信息处理广西高校重点实验室科学计算与智能信息处理广西高校重点实验室科学计算与智能信息处理广西高校重点实验室GeneExpressionProgramming2024/2/262024/2/26周周一一2 2创始人Candida FerreiraCandida Ferreira 于于19951995年年在里斯本大学在里斯本大学获获得生物学博士后,得生物学博士后,一直从事与生物基因和生物化学相一直从事与生物基因和生物化学相关的研究,当关的研究,当时遗传时遗传算法(算法(GA
2、GA)和)和遗遗传编传编程(程(GPGP)已日臻成熟。在生物基)已日臻成熟。在生物基因表达的启示下,她融合了因表达的启示下,她融合了GAGA和和GPGP的的优优点,点,经过经过五年五年时间时间的的酝酿酝酿,终终于使得于使得GEPGEP瓜熟蒂落,瓜熟蒂落,实现实现了又一了又一次跨学科的革新。次跨学科的革新。2024/2/262024/2/26周周一一3 3引入国内川大数据库与知识工程研究所的研究团队的博士生们,特别是左劼博士,在FerreiraC原创性论文在网上出现10多天,尚未正式发表时,以特有的兴趣和学术敏感,捕捉了机会,把GEP引入到国内,在国际会议WAIM2002上,左劼、唐常杰等发表了
3、国内学者第一篇关于GEP的研究论文。在元昌安教授带领的广西师范学院“科学计算与智能信息处理”研究团队中,各个成员在汲取GEP带来的甘露,同时也在收获着丰硕的果实。2024/2/262024/2/26周周一一4 4一GEP基本概念二GEP特点三GEP研究状况四GEP算法过程五简单应用2024/2/262024/2/26周周一一5 5GEP基本概念GEP(Gene Expression Programming)基因表达式编程基因表达式编程GEP是借用了生命科学中基因、染色体等概念和思路,通过遗传进化进行数据挖掘、公式发现,以及最优化的一种新算法。GEPGEP是在数据挖掘的沃土中,是在数据挖掘的沃土
4、中,从从遗传计遗传计算算这这棵老棵老树树上开出的新花上开出的新花 2024/2/262024/2/26周周一一6 6 基因基因基因基因是构成染色体的是构成染色体的是构成染色体的是构成染色体的基本基本基本基本单单位位位位.知知知知识识点点点点(知知知知识识基因)基因)基因)基因)基因基因+,-,*,/,sqrt,1,a,b,c,d+,-,*,/,sqrt,1,a,b,c,d,sin(x),cos(x)sin(x),cos(x)基因分基因分基因分基因分类类函数符(运算符,函数)函数符(运算符,函数)例如:例如:+,-,*,/,sqrt+,-,*,/,sqrt,.,sin(x),cos(x).,si
5、n(x),cos(x)终结终结符(符(变变量,常量)量,常量)例如:例如:a,b,c,da,b,c,d ,1.1.基因2024/2/262024/2/26周周一一7 7 基因基因基因基因是构成染色体的是构成染色体的是构成染色体的是构成染色体的基本基本基本基本单单位位位位.知知知知识识点点点点(知知知知识识基因)基因)基因)基因)基因基因+,-,*,/,sqrt,1,a,b,c,d+,-,*,/,sqrt,1,a,b,c,d,sin(x),cos(x)sin(x),cos(x)基因分基因分基因分基因分类类函数符(运算符,函数)函数符(运算符,函数)例如:例如:+,-,*,/,sqrt+,-,*,
6、/,sqrt,.,sin(x),cos(x).,sin(x),cos(x)终结终结符(符(变变量,常量)量,常量)例如:例如:a,b,c,da,b,c,d ,1.1.基因不不仅仅仅仅是是0101位串位串2024/2/262024/2/26周周一一8 8 基因基因基因基因是构成染色体的是构成染色体的是构成染色体的是构成染色体的基本基本基本基本单单位位位位.知知知知识识点点点点(知知知知识识基因)基因)基因)基因)基因基因+,-,*,/,sqrt,1,a,b,c,d+,-,*,/,sqrt,1,a,b,c,d,sin(x),cos(x)sin(x),cos(x)基因分基因分基因分基因分类类函数符(
7、运算符,函数)函数符(运算符,函数)例如:例如:+,-,*,/,sqrt+,-,*,/,sqrt,.,sin(x),cos(x).,sin(x),cos(x)终结终结符(符(变变量,常量)量,常量)例如:例如:a,b,c,da,b,c,d ,1.1.基因2024/2/262024/2/26周周一一9 9基因 在在GEP中,有两个主体:染色体和表中,有两个主体:染色体和表达式树,遗传信息在染色体中,而表达式达式树,遗传信息在染色体中,而表达式树则是染色体的表达。从染色体到表达式树则是染色体的表达。从染色体到表达式树的解码过程称为翻译。树的解码过程称为翻译。GEP的基因码是的基因码是染色体与其所表
8、示的函数与终结符之间一染色体与其所表示的函数与终结符之间一对一的关系,翻译的规则决定了函数与终对一的关系,翻译的规则决定了函数与终结符在表达式树中的空间位置以及在复合结符在表达式树中的空间位置以及在复合系统中子表达式树之间的交互类型系统中子表达式树之间的交互类型 在在GEP中,基因组或染色体是一个线中,基因组或染色体是一个线性的固定长度的符号串,是不同形状和大性的固定长度的符号串,是不同形状和大小的表达式树的编码。小的表达式树的编码。GEP的基因与生物基因的的基因与生物基因的ORF(Open Reading Frame)的形式相似,而的形式相似,而GEP基因基因的起始点总是第一个符号,终止点并
9、不一的起始点总是第一个符号,终止点并不一定是最后一个符号,终止点后的符号组成定是最后一个符号,终止点后的符号组成GEP基因的非编码区。基因的非编码区。2024/2/262024/2/26周周一一1010 终结终结符符符符 终结终结符是提供符是提供给给系系统值统值的最末端的最末端结结构。构。终结终结符自己提供信息符自己提供信息,但不但不处处理另外的信息。通常理另外的信息。通常,终结终结符包括符包括GEPGEP程序中的程序中的输输入、入、常量或者无参数函数。常量或者无参数函数。如果用如果用树树形形结结构来表示程序,构来表示程序,终结终结符代表符代表树树的的这这些些叶叶节节点。当程序运行的点。当程序
10、运行的时时候,候,这这些叶些叶节节点要么接受外部点要么接受外部的的输输入、要么自己就是一个常量或者自己就能入、要么自己就是一个常量或者自己就能计计算算产产生生一个量。它一个量。它们们向系向系统统中提供信息,中提供信息,以供系以供系统处统处理。理。通常用通常用T T 或者或者T TGEPGEP 表示一个表示一个GEPGEP算法的算法的终结终结符集合,符集合,用用t t T T表示表示终结终结符集合中的符集合中的终结终结符。符。2024/2/262024/2/26周周一一1111 函数函数函数函数 GEPGEP中的函数概念相当广泛中的函数概念相当广泛,它包括系它包括系统统的中的中其他任何非其他任何
11、非终结终结符的中符的中间结间结构。构。函数集合可以包括与函数集合可以包括与应应用有关的用有关的问题领问题领域的运域的运算符号算符号,也可以包括程序也可以包括程序设计语设计语言中的程序构件言中的程序构件,甚甚至是表示系至是表示系统统中中间层间层次的一种符号。次的一种符号。如果用如果用树树形形结结构来表示程序,函数一般位于表构来表示程序,函数一般位于表达式达式树树的非叶的非叶节节点。点。2024/2/262024/2/26周周一一1212 函数函数函数函数(续续)对对于常于常见见的以公式的以公式发现为发现为目目标标的的应应用中,用中,以下以下是一些常是一些常见见的函数的函数:算算术术运算符,例如运
12、算符,例如+、-、*、等;等;初等数学函数,例如初等数学函数,例如sinsin,coscos 等等;其他一些函数其他一些函数,例如例如maxmax,min min 等;等;布布尔尔运算符,例如运算符,例如、等等;关系运算符关系运算符,例如例如 、=、等;等;条件运算符,条件运算符,if-then-elseif-then-else;自定自定义义函数。函数。2024/2/262024/2/26周周一一1313 函数函数函数函数(续续)通常用通常用F F 或或F FGEPGEP 表示一个表示一个GEPGEP算法的算法的终结终结符符(函函数符号数符号)集合,集合,每一个函数每一个函数f f F F 记
13、为记为 f f(p p1 1,p p2 2,,p pmm)其参数个数其参数个数记为记为 (f f)=)=mm 函数参数的最大个数函数参数的最大个数为为函数集合中所有函数的函数集合中所有函数的参数个数的最大参数个数的最大值值,记为记为 (F F)=max()=max(f f)|)|f f F F)2024/2/262024/2/26周周一一1414基因组(Genome)多个基因多个基因多个基因多个基因按照按照按照按照一定规则一定规则一定规则一定规则构成的基因串,称为构成的基因串,称为构成的基因串,称为构成的基因串,称为基因组基因组基因组基因组。实例实例实例实例参数:头长参数:头长h h,函数符,
14、函数符+*/,终结符终结符a a,b b 0123456*+abaaa结构结构结构结构头部头部函数符终结符函数符终结符尾部尾部终结符终结符规则规则规则规则t th h(n n)2024/2/262024/2/26周周一一1515基因组(Genome)多个基因多个基因多个基因多个基因按照按照按照按照一定规则一定规则一定规则一定规则构成的基因串,称为构成的基因串,称为构成的基因串,称为构成的基因串,称为基因组基因组基因组基因组。实例实例实例实例参数:头长参数:头长h h,函数符,函数符+*/,终结符终结符a a,b b 0123456*+abaaa结构结构结构结构头部头部函数符终结符函数符终结符尾
15、部尾部终结符终结符规则规则规则规则t th h(n n)2024/2/262024/2/26周周一一1616基因组(Genome)多个基因多个基因多个基因多个基因按照按照按照按照一定规则一定规则一定规则一定规则构成的基因串,称为构成的基因串,称为构成的基因串,称为构成的基因串,称为基因组基因组基因组基因组。实例实例实例实例参数:头长参数:头长h h,函数符,函数符+*/,终结符终结符a a,b b 0123456*+abaaa结构结构结构结构头部头部函数符终结符函数符终结符尾部尾部终结符终结符规则规则规则规则t th h(n n)2024/2/262024/2/26周周一一1717基因组(Ge
16、nome)多个基因多个基因多个基因多个基因按照按照按照按照一定规则一定规则一定规则一定规则构成的基因串,称为构成的基因串,称为构成的基因串,称为构成的基因串,称为基因组基因组基因组基因组。实例实例实例实例参数:头长参数:头长h h,函数符,函数符+*/,终结符终结符a a,b b 0123456*+abaaa结构结构结构结构头部头部函数符终结符函数符终结符尾部尾部终结符终结符规则规则规则规则t th h(n n)2024/2/262024/2/26周周一一1818基因组(Genome)多个基因多个基因多个基因多个基因按照按照按照按照一定规则一定规则一定规则一定规则构成的基因串,称为构成的基因串
17、,称为构成的基因串,称为构成的基因串,称为基因组基因组基因组基因组。实例实例实例实例参数:头长参数:头长h h,函数符,函数符+*/,终结符终结符a a,b b 0123456*+abaaa结构结构结构结构头部头部函数符终结符函数符终结符尾部尾部终结符终结符规则规则规则规则t th h(n n)例:例:+,-,*,/+,-,*,/n=2 n=22024/2/262024/2/26周周一一1919染色体(Chromosome)一个或多个基因组构成一个染色体。单基因组染色体实例:*+a+abaaabaaa 多基因多基因组组染色体染色体 实实例:例:*+a+a b a a ab a a a +/+/
18、+b b a b b b a b b/b b/b b b b ab b b a 多个基因多个基因多个基因多个基因按照按照按照按照一定一定一定一定规则规则构成构成构成构成的基因串,称的基因串,称的基因串,称的基因串,称为为基因基因基因基因组组。2024/2/262024/2/26周周一一2020染色体(Chromosome)一个或多个基因组构成一个染色体。单基因组染色体实例:*+a+abaaabaaa 多基因多基因组组染色体染色体 实实例:例:*+a+a b a a ab a a a +/+/+b b a b b b a b b/b b/b b b b ab b b a 2024/2/26202
19、4/2/26周周一一2121染色体构成基因基因组染色体数学表达式?2024/2/262024/2/26周周一一2222染色体基因基因组染色体数学表达式?2024/2/262024/2/26周周一一2323染色体基因基因组染色体数学表达式?2024/2/262024/2/26周周一一2424染色体数学表达式解析过程:染色体表达式树(ET)数学表达式2024/2/262024/2/26周周一一2525染色体数学表达式解析过程:染色体表达式树(ET)数学表达式2024/2/262024/2/26周周一一2626单基因组染色体的解析单基因组染色体:*+abaaa表达式(树)解析规则:从上到下,从左到右
20、,直到叶结点全为终结符。(b ba a)aa0 1 2 3 4 5 0 1 2 3 4 5 6 62024/2/262024/2/26周周一一2727单基因组染色体的解析单基因组染色体:*+abaaa表达式(树)解析规则:从上到下,从左到右,直到叶结点全为终结符。(b ba a)aa0 1 2 3 4 5 0 1 2 3 4 5 6 62024/2/262024/2/26周周一一2828单基因组染色体的解析单基因组染色体:*+abaaa表达式(树)解析规则:从上到下,从左到右,直到叶结点全为终结符。(b ba a)aa0 1 2 3 4 5 0 1 2 3 4 5 6 62024/2/2620
21、24/2/26周周一一2929单基因组染色体的解析单基因组染色体:*+abaaa表达式(树)解析规则:从上到下,从左到右,直到叶结点全为终结符。(b ba a)aa*为为两目运算两目运算0 1 2 3 4 5 0 1 2 3 4 5 6 62024/2/262024/2/26周周一一3030单基因组染色体的解析单基因组染色体:*+abaaa表达式(树)解析规则:从上到下,从左到右,直到叶结点全为终结符。(b ba a)aa0 1 2 3 4 5 0 1 2 3 4 5 6 62024/2/262024/2/26周周一一3131单基因组染色体的解析单基因组染色体:*+abaaa表达式(树)解析规
22、则:从上到下,从左到右,直到叶结点全为终结符。(b ba a)aa0 1 2 3 4 5 0 1 2 3 4 5 6 62024/2/262024/2/26周周一一3232单基因组染色体的解析单基因组染色体:*+abaaa表达式(树)解析规则:从上到下,从左到右,直到叶结点全为终结符。(b ba a)aa0 1 2 3 4 5 0 1 2 3 4 5 6 62024/2/262024/2/26周周一一3333单基因组染色体的解析单基因组染色体:*+abaaa表达式(树)解析规则:从上到下,从左到右,直到叶结点全为终结符。(b ba a)aa表示怎表示怎样样一一个表达式个表达式?0 1 2 3
23、4 5 0 1 2 3 4 5 6 62024/2/262024/2/26周周一一3434单基因单基因组染色体的解析单基因组染色体:*+abaaa表达式(树)解析规则:从上到下,从左到右(b ba a)aa2024/2/262024/2/26周周一一3535单基因组染色体的解析单基因组染色体:*+abaaa表达式(树)解析规则:从上到下,从左到右(b ba a)aa2024/2/262024/2/26周周一一3636单基因组染色体的解析单基因组染色体:*+abaaa表达式(树)解析规则:从上到下,从左到右(b ba a)aa2024/2/262024/2/26周周一一3737GEP基因的非编码
24、区 GEPGEP基因长度是固定的,但基因长度是固定的,但基因长度是固定的,但基因长度是固定的,但K-K-表达式的长度一般是表达式的长度一般是表达式的长度一般是表达式的长度一般是等于或小于基因的长度,从上面的例子可以看出,等于或小于基因的长度,从上面的例子可以看出,等于或小于基因的长度,从上面的例子可以看出,等于或小于基因的长度,从上面的例子可以看出,K-K-表达式的结束子在位置表达式的结束子在位置表达式的结束子在位置表达式的结束子在位置4 4,从位置,从位置,从位置,从位置5 5到位置到位置到位置到位置6 6都是基因都是基因都是基因都是基因的非编码区。基因的非编码区是的非编码区。基因的非编码区
25、是的非编码区。基因的非编码区是的非编码区。基因的非编码区是GEPGEP演化的关键,正演化的关键,正演化的关键,正演化的关键,正是因为它,才使得对基因组使用任何遗传操作成为可是因为它,才使得对基因组使用任何遗传操作成为可是因为它,才使得对基因组使用任何遗传操作成为可是因为它,才使得对基因组使用任何遗传操作成为可能。能。能。能。*+a+abaaabaaa看下面的例子:看下面的例子:看下面的例子:看下面的例子:0 1 2 3 4 5 60 1 2 3 4 5 62024/2/262024/2/26周周一一3838对应对应的表示的表示树为树为:K-K-表达式:表达式:01234567890123456
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GEP 来龙去脉 PPT 系统 学习
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【胜****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【胜****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。