基于CNN双路特征融合模型的秀丽隐杆线虫寿命阶段分类研究.pdf
《基于CNN双路特征融合模型的秀丽隐杆线虫寿命阶段分类研究.pdf》由会员分享,可在线阅读,更多相关《基于CNN双路特征融合模型的秀丽隐杆线虫寿命阶段分类研究.pdf(6页珍藏版)》请在咨信网上搜索。
1、2023 年第 5 期计算机与数字工程收稿日期:2022年11月4日,修回日期:2022年12月20日作者简介:尹彦豪,男,硕士研究生,研究方向:图像处理。刘俊,男,博士,教授,研究方向:图像处理、医学图像分析、机器学习等。杨烨,男,博士研究生,研究方向:细胞生理学。1引言秀丽隐杆线虫是生物学研究中最重要的无脊椎模式生物之一,有着生命周期较短、生理结构简单、与人类基因高度同源、虫体透明便于观察等特点,从19世纪70年代初开始,就作为功能强大的模式生物被广泛应用1。它的研究跨越了多个学科领域,包括基因大规模功能与表征研究2,全身细基于 CNN 双路特征融合模型的秀丽隐杆线虫寿命阶段分类研究尹彦豪
2、1,2刘俊1,2杨烨3(1.武汉科技大学计算机科学与技术学院武汉430065)(2.智能信息处理与实时工业系统湖北省重点实验室武汉430065)(3.华中科技大学生命科学与技术学院武汉430074)摘要秀丽隐杆线虫(C.elegans)由于其有着寿命较短和人类基因高度同源的特点,作为一种被优秀的模式生物,被广泛应用于多种人类健康和疾病模型的研究中。为了准确测定当前线虫所处于的寿命阶段,论文提出了一种基于CNN双路特征融合模型的的秀丽隐杆线虫寿命阶段分类方法。首先,利用卷积神经网络分类模型对线虫图像进行特征提取;同时使用快速傅里叶变换、LoG算子等图像处理算法得到荧光蛋白亮斑坐标,然后根据坐标信
3、息计算得到荧光蛋白亮斑聚集度信息;最后,将前两步得到的特征拼接通过分类器得到分类结果。实验结果表明,论文方法能够准确、有效地对线虫寿命阶段进行分类。关键词秀丽隐杆线虫;图像分类;深度学习;快速傅里叶变换;拉普拉斯-高斯算法中图分类号TP391DOI:10.3969/j.issn.1672-9722.2023.05.033Research on Classification of Caenorhabditis Elegans Life StageBased on CNN Dual-Path Feature FusionYIN Yanhao1,2LIU Jun1,2YANG Ye3(1.Colle
4、ge of Computer Science and Technology,Wuhan University of Science and Technology,Wuhan430065)(2.Hubei Province Key Laboratory of Intelligent Information Processing and Real-time Industrial System,Wuhan430065)(3.College of Life Science and Technology,Huazhong University of Science and Technology,Wuha
5、n430074)AbstractAs an excellent model organism,C.elegans has been widely used in many human health and disease researchesdue to its short life span and high homology with human genes.In order to accurately determine the life stage of Caenorhabditis elegans,a classification method of caenorhabditis e
6、legans life stage based on CNN Dual-Path feature fusion model is proposed.Firstly,the convolutional neural network classification model is used to extract the features of the nematode image.At the same time,fast Fourier transform,LoG operator and other image processing algorithms are used to obtain
7、the fluorescent protein bright spot coordinates.Then the degree of aggregation of fluorescent protein bright spots is calculated according to the coordinate information.Finally,the features obtained in the first two steps are spliced through the classifier to obtain the classification result.Experim
8、ental results show that this method can accurately and effectively classify the life stages of nematodes.Key Wordscaenorhabditis elegans,image classification,deep learning,fast Fourier transform,Laplacian of Gaussian algorithmClass NumberTP391总第 403期2023 年第 5期计算机与数字工程Computer&Digital EngineeringVol.
9、51No.51163第 51 卷胞的完整谱系追踪3以及动物神经系统连接组的结构体构建4等。秀丽隐杆线虫也为研究导致个体健康与寿命差异的变异性诱因提供了一个理想的模型:其在两周的寿命周期中体现出来的相对变异性与人类从出生到80岁时几乎一样多,因此对线虫不同寿命阶段差异性的研究对人类健康和衰老具有重要意义5。近年来随着机器学习和人工智能等前沿技术在生物学研究方面的应用,已有很多学者将深度学习等方法引用于线虫寿命测定中。本文选用蛋白稳态失衡现象作为线虫寿命阶段分类的指示器6,使用萤火虫荧光素酶蛋白辅助观测。由于拍摄数据集时线虫处于存活状态且获取荧光蛋白亮斑需要相对较长的曝光时间,本文数据集图像存在模
10、糊,有效特征区域较小等问题。为了在此前提下得到更好的分类效果,本文提出基于卷积神经网络的双路特征融合模型,对线虫图像进行特征学习。该方法将深度学习提取的特征和基于先验知识提取的荧光蛋白聚集度特征相连接,共同作用于分类结果。实验结果表明,该方法能够有效提高线虫寿命阶段分类准确率。2相关工作关于秀丽隐杆线虫的寿命评估问题,目前有两个主要的研究方向,一类是利用生理特征进行评估,另一类是利用生物感受器进行评估。生理特征评估是指根据可直接观察到的线虫的生理特征表现,例如咽部吞咽速率、图像熵测定、外观测定、运动能力测定以及自荧光测定等。利用生理特征评估的优势在于有着较高的准确率以及适用于多种线虫突变株,但
11、由于研究局限于线虫本体,缺乏技术迁移的可能性,对人体研究意义较为有限。相比利用生理特征,生物感受器主要由寿命相关基因或microRNA启动子携带荧光蛋白构成,基因背后相关信号通路机制清晰,存在着技术迁移的可能性,对人类衰老阶段评估有潜在指导意义7。但在实际研究中发现,目前的生物感受器存在以下两方面问题。一方面,生物感受器整体性能相对较低,这可能是由于单一基因本身对于寿命影响力有限导致的。另一方面,部分内源性基因,在野生型中具有一定评估效力,但在特定突变虫株(如daf-16)中往往评估能力较差,这主要是由于评估使用的基因往往受限于特定信号通路,而衰老现象由多条信号通路共同调控8。鉴于以上两种方式
12、存在的缺陷,本文选用蛋白稳态失衡作为寿命相关指示器。这是因为绝大部分生物活动均依赖于蛋白功能,秀丽隐杆线虫中多条寿命相关信号通路均表现出对蛋白稳态的调控,随着线虫的衰老,蛋白的聚集会逐渐增多,同时在人类衰老的过程中,蛋白稳态失衡也多种老年病相关,例如阿兹海默症、帕金森病等6,9。为了便于对线虫体内蛋白聚集的观察,本文在多种亚稳态蛋白中选取了未报道病理过程相关的萤火虫荧光素酶蛋白(firefly luciferase)10,携带多拷贝萤火虫荧光素酶基因线虫不会出现早衰以及瘫痪的表型。因此,选用亚稳态蛋白作为观察目标既能具有较高的准确性,又对人类健康和寿命研究具有较好的迁移性的评估方式。随着深度学
13、习方法的发展与应用,目前已有研究人员将深度学习强大的特征提取能力运用于秀丽隐杆线虫的寿命测定相关研究上。如Martineau11等从线虫活动视频中提取到的数百种形态、姿势和行为特征,并使用支持向量机(SVM)对其于线虫寿命直接的关系进行分析。Lin12等通过将线虫曲直信息作为全集特征引入基于卷积神经网络的线虫寿命天数逻辑回归分析模型,其精度高达0.8478,已获得较好的评估结果。Sahand13等选用生物感受器作为研究对象,为采用Mask R-CNN算法识别线虫PVD神经元衰老后出现的神经变性亚细胞突起,并以此对线虫当前寿命阶段进行判定,将线虫的生物状态分为年轻、老化、冷休克三个状态,最终得到
14、0.85的分类准确率。但是Martineau和Lin均采用线虫生理特征进行评估,其研究仅局限于线虫本身,缺乏可迁移性。Sahand仅将线虫生物状态分为3类研究,分类阶段较为简单。针对以上方法的局限性,本文提出基于深度神经网络的双路特征融合模型不仅可以通过神经网络提取线虫的局部特征,还能通过计算荧光蛋白聚集度信息弥补其在全局特征上的损失,最终输出线虫寿命周期6阶段分类结果。3本文方法本文采用携带外源性荧光素酶融合蛋白的活体线虫图像进行实验。在拍摄时为了获取清晰的荧光蛋白亮斑,需要较长的曝光时间,且无法控制虫体的姿态和位置,使得同一类别下的图像差异过大(如图1所示),同时由于拍摄获取的图像分辨率为
15、60004000,需要将图像压缩后才能进入神经网络框架训练学习,该过程会使大量较小的荧光蛋白亮斑特征丢失。导致在图像的中的全局特征参存在丢失的现象。尹彦豪等:基于CNN双路特征融合模型的秀丽隐杆线虫寿命阶段分类研究11642023 年第 5 期计算机与数字工程图1同一寿命阶段不同个体图像对比本文对于秀丽隐杆线虫寿命阶段分类问题的研究,提出采用卷积神经网络双路特征融合模型,通过引入一个新的附加属性聚集度信息作为全局特征,以提高实验模型的分类准确率。本文模型的总体框架如图 2 所示,分为两个主要的模块:CNN 特征提取模块M1和聚集度特征提取模块M2。子模块M1部分共有4个串行的卷积模块,每个卷积
16、模块分为4个层,每一层均由一个2D卷积层组成,同时将该层的输出与之前每一层的输出连接,作为下一层的输入使用,最后一层经过全局均值池化后,得到特征向量F1。在子模块M2中,首先用快速傅里叶变换增强图像中的亮斑特征,再使用LoG算子获取线虫虫体上荧光蛋白亮斑的坐标信息。通过坐标信息可以计算得到线虫荧光亮斑的聚集度信息Pi。将算得的前 n 个聚集度信息(P1P2Pn)作为特征向量F2。将特征向量F1与特征向量F2连接,再连接两层全连接层,最后经过Softmax分类器输出线虫寿命阶段分类的评估结果。线虫图像图像特征增强荧光蛋白亮斑检测聚焦度信息计算M1子模块全局均值池化M2子模块Softmax分类器线
17、虫寿命阶段图2CNN双路特征融合模型总体框架3.1CNN特征提取子模块秀丽隐杆线虫图像中有效特征区域较小,且不同寿命阶段的线虫图像具有较高的相似性,与自然图像分类任务相比,线虫图像分类任务更注重细粒度层面的特征信息。因此,本文在子模块M1中引入由 Gao14等提出的密集连接网络 DenseNet的网络模型。该网络模型在残差结构部分的思想借鉴于He15等提出的ResNet网络模型:通过使用残差映射替代恒等映射的方式,可以有效地学习到每个残差块输入与输出的差异部分,在模型收敛到一定程度时,输入的信息可以跳过部分模型,对深层模型进行有效的训练,进而降低了在过深的模型中存在网络退化的梯度消失的问题。D
18、enseNet借鉴残差映射的思路,将每一层的输出密集连接后作为下一层的输入使用,同时在相同的目标精度下,其参数和计算量仅为ResNet的一半。b1_blockb2_block,b3_block,b4_blockConv 55Conv 33Conv 33Conv 33Conv 33Conv 33Conv 33BNReLUConv 113GAPF2图3M1子模块的特征提取过程基于卷积神经网络的特征提取子模块M1是整个线虫寿命阶段分类模型的基础。该模块由4个卷积模块组成,分别标记为b1、b2、b3、b4,如图3所示。由于模块b1中的特征图过大,在模型训练时对训练速度存在一定的影响。其次,模块b1中得
19、到的浅层语义信息相比b2存在一定的差距,对模型训练效果影响较小,因此在子模块M1的设计中,b1由3个卷积层构成,b2、b3、b4则均采用密集块(Dense Block)结构。每个卷积模块间均采用过度块连接(Transition Block),包括批归一化处理(Batch Normalizaion)16,激活函数ReLU和一个11大小的卷积核进行卷积。该模块可以在一定程度上起到加快网络收敛,缓解网络过拟合,防止梯度消失和梯度爆炸,减少网络参数量的作用。将该模块的最终输出特征图经过全局均值池化后得到特征向量F1。使得向量F1更能表达线虫不同寿命1165第 51 卷阶段的细粒度特征。3.2聚集度特征
20、提取子模块通过M1模块已经得到线虫图像的特征向量F1,并且其中包含丰富的语义信息,但是ROI轮廓信息等宏观层面的信息则较为粗略。而且图像在进入M1模块前需要经过均值池化,这一过程中很多较小的荧光蛋白亮斑会存在丢失现象。因此加入通过传统图像特征提取算法获取到的聚集度信息来弥补这一部分的信息丢失,使最终提取到的语义信息更具有鲁棒性。本文提出的聚集度特征提取子模块M2分为三个步骤,首先,使用快速傅里叶变换(FFT)对图像进行特征增强。其次,使用高斯-拉普拉(LOG)算子获取所有荧光蛋白亮斑的坐标信息。最后,使用得到的荧光蛋白亮斑坐标信息计算得到聚集度信息Pi,并再用其求出特征向量F2,与M1模块最终
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 CNN 特征 融合 模型 秀丽 线虫 寿命 阶段 分类 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。