星载图像实时无损压缩系统的FPGA设计与实现_张丽丽.pdf
《星载图像实时无损压缩系统的FPGA设计与实现_张丽丽.pdf》由会员分享,可在线阅读,更多相关《星载图像实时无损压缩系统的FPGA设计与实现_张丽丽.pdf(7页珍藏版)》请在咨信网上搜索。
1、 实 验 技 术 与 管 理 第 40 卷 第 2 期 2023 年 2 月 Experimental Technology and Management Vol.40 No.2 Feb.2023 收稿日期:2022-08-31 基金项目:国家自然科学基金项目(61671310);辽宁省教育厅项目(LJKZ0174);辽宁省教改项目(辽教办2021254 号)作者简介:张丽丽(1979)女,黑龙江讷河,博士,副教授,系主任,主要研究方向为 FPGA 系统设计与深度学习,。通信作者:刘雨轩(1998),男,辽宁锦州,硕士研究生,主要研究方向为 FPGA 系统设计与深度学习,。引文格式:张丽丽,刘
2、雨轩,张雷,等.星载图像实时无损压缩系统的 FPGA 设计与实现J.实验技术与管理,2023,40(2):057-062.Cite this article:ZHANG L L,LIU Y X,ZHANG L,et al.FPGA design and implementation of real-time lossless compression system for satellite imageJ.Experimental Technology and Management,2023,40(2):057-062.(in Chinese)ISSN 1002-4956 CN11-2034/T
3、 DOI:10.16791/ki.sjg.2023.02.009 星载图像实时无损压缩系统的 FPGA 设计与实现 张丽丽,刘雨轩,张 雷,蔡健楠(沈阳航空航天大学 电子信息工程学院,辽宁 沈阳 110136)摘 要:为实现星载宽幅图像实时无损压缩,针对图像压缩 JPEG-LS 算法,在预测模块向前预测基础上,调整了算法参数更新计算结构,采取了向前预测两级参数策略,并在不影响压缩质量的前提下实现了全流水线结构。在编码模块,采用有限长编码方式,防止了误差值较大时使编码结果产生过多连续的零,导致编码长度剧增、降低编码性能问题。基于 Xilinx 公司的 xc7k325tffg900 现场可编程门阵
4、列(FPGA)芯片,在正常编码模式下,解决了该算法自身反馈结构制约硬件流水线实现,从而导致工作频率低的问题。该文提出的结构不仅可以满足实时处理星上图像数据需求,其参数化的设计还可使系统动态调整输入图像参数,根据不同的应用环境进行参数配置。该文算法最大可处理尺寸为 6 1446 144 的宽幅图像,最高工作频率可达 220 MHz,系统输入图像数据的最大传输带宽可达 3.52 Gbps。关键词:无损压缩;JPEG-LS 算法;FPGA 芯片;向前预测;全流水线结构 中图分类号:TN919.81 文献标识码:A 文章编号:1002-4956(2023)02-0057-06 FPGA design
5、and implementation of real-time lossless compression system for satellite image ZHANG Lili,LIU Yuxuan,ZHANG Lei,CAI Jiannan(College of Electronical and Information Engineering,Shenyang Aerospace University,Shenyang 110136,China)Abstract:In order to achieve real-time lossless compression of spaceborn
6、e wide images,for the JPEG-LS algorithm of image compression,based on the forward prediction of the prediction module,the algorithm parameter update calculation structure is adjusted,a two-level forward prediction parameter strategy is adopted,and a full pipeline structure is realized without affect
7、ing the compression quality.In the coding module,the finite length coding method is adopted to prevent the coding result from generating too many consecutive zeros when the error value is large,leading to a sharp increase in the coding length and reducing the coding performance.Based on the xc7k325t
8、ffg900 field programmable gate array(FPGA)chip of Xilinx Company,under the normal coding mode,the problem that the feedback structure of the algorithm restricts the hardware pipeline implementation has been solved,which leads to low working frequency.The proposed structure can meet the requirements
9、of real-time processing of satellite image data and enable the system to dynamically adjust the input image parameters according to different application environments.The maximum size of the algorithm in this paper is 6 144 6 144 wide images,the maximum working frequency can reach 220 MHz,and the ma
10、ximum transmission bandwidth of the system input image data can reach 3.52 Gbps Key words:lossless compression;algorithm-JPEG-LS;FPGA chip;forward prediction;full-pipeline construction 58 实 验 技 术 与 管 理 1 背景 随着传感器技术的发展和航空航天科技的进步,机载和星载遥感设备瞬时产生的海量数据对实时传输系统传输带宽的要求日趋提高。卫星上拥有较多载荷,输入原始码数据率高,图像数据保真度要求高1,为保证
11、传输图像的质量,通常采用无损压缩。目前针对图像压缩的算法比较成熟。例如:JPEG2000、Karhunen-Loeve Transform(KLT)、Pairwise Prthogonal Transform(POT)等基于变换的方法可有效去除像素之间的相关性,有较高的压缩效率,但算法复杂度较高,不易实现2;基于深度学习的压缩方法3通过自编码器同时学习图像的特征和概率分布,无需先验知识,但需要大量的数据进行训练4,并且在部署时对硬件资源的要求较高;而针对普通 2D 图像的 JPEG-LS 标准使用预测方式去除相关性,能使其具有良好的压缩性能与较低的算法复杂度,更适合于硬件实现5-8。从硬件角度
12、出发,为了提高系统的运行速率,使之能对图像数据进行实时处理,应采取流水线方式。然而在 JPEG-LS 算法标准中,当连续的像素具有相同的上下文时,由于下一个像素的编码需用到上一个像素编码后更新的参数,这就会制约流水线结构的速度。传统的提高数据吞吐率的方法是将一帧图像分成多个小块,并行处理9。但是在速度要求较高的场景中必须将图像划分为更多的小块以满足需求,这不仅会增加硬件资源的开销,而且过小的子块使得上下文信息更少,更不利于 JPEG-LS 基于上下文的压缩方式10。因此,为满足高速压缩的条件,单核压缩器数据处理速度的提高尤为重要。文献9提出延时参数更新的并行运算结构会导致压缩结果失真,不能满足
13、无损压缩需求;文献11提出的全流水线结构最大只能支持 8 bit位宽的数据;文献12仅能在相邻像素对应不同上下文时才可达到全流水线处理;文献1314提出的向前预测参数 C 的机制并没有对参数 B 的反馈进行处理,导致频率无法进一步提高;文献15从提高算法的压缩比角度,根据序列天文图像的特点,利用去除帧间冗余的方法来对算法进行优化。本文针对包含极少平坦区域的星载图像样本,以实现数据实时高速处理为目标,在正常编码模式下,提出了一种新的全流水向前预测结构。该结构提高了单核压缩器的数据处理速度,对于宽幅图像无需分块处理或用外部、内部的存储器缓存图像,且整个系统参数可动态配置。相比于现有技术,处理速度快
14、、资源占用率少、使用更灵活。本文所述系统是以航天企业实际需求为导向的。将该项目引入 FPGA 课程实践,能够使学生在学习过程中,将理论与实践深度融合,在解决实际工程问题的同时,切实提升工程实践能力和创新意识。2 JPEG-LS 压缩算法分析 在 JPEG-LS 算法中,首先需用当前像素 Ix 和周围的像素值对上下文进行建模。并将梯度值 D1、D2、D3 量化为 Q1、Q2、Q3,再映射成正数 Q 后确定一种上下文模型。当 JPEG-LS 算法对上下文完成建模后,有一个很长的数据回路存在于场景统计信息 B、C 与误差值ErrVal 之间,误差值的修正取决于场景统计的信息,同时场景统计信息的更新取
15、决于误差值的计算结果16。二者的计算有很强的先后次序,无法进行并行计算,是制约硬件运行速度的瓶颈17。3 系统架构设计 JPEG-LS 压缩系统框图如图 1 所示。由于星载获取的某些图像的特性,对于无损压缩,很难进入到游长模式18,而且星载设备的资源极为有限,为了节约资源,系统中只采用正常编码模式。整个系统分为四个模块,控制模块用于动态配置压缩器参数,并通过外部 fifo 状态控制压缩器工作状态;缓存模块用于缓存一行像素,并求出上下文建模需要的像素值 Ix、Ra、Rb、Rc 和梯度值 D1、D2、D3;预测模块用于普通模式下对像素值的预测和误差计算;Golomb 编码模块用于对误差进行 Gol
16、omb-rice 编码。由于需要更新上下文参数和计算误差,所以预测模块是整个系统中唯一出现反馈的位置,需采取向前预测方式并行更新参数,从而实现全流水线结构。其余模块均无反馈回路,可直接实现全流水线结构。图 1 系统框图 4 FPGA 设计与实现 4.1 控制模块 信号 sof 与 eof 用于控制压缩器开始工作和停止工作。图像的高和宽用 x_len 与 y_len 信号控制,在sof 有效时锁存 x_len 与 y_len 信号。在接收到 sof 信 张丽丽,等:星载图像实时无损压缩系统的 FPGA 设计与实现 59 号后,压缩器会产生 r_fifo_en 信号读取前端 fifo 中的数据。如
17、果 r_empty 或 w_full 有效,即前端 fifo 为空或后端 fifo 为满,则标志没有数据可以压缩或已压缩数据无处存放。此时压缩器就会暂停工作,令 r_fifo_en为低,暂停从前端 fifo 读取数据,直到前端 fifo 有新的数据并且后端 fifo 有新的位置存放数据。4.2 传统预测模块的局限性 预测模块通过当前上下文模型中的像素值求出预测值 Px,经过误差修正参数 C 修正后与 Ix 求出误差ErrVal,同时用前向预测误差参数 A 与发生次数计量参数 N 求出对应的 k 值(Golomb 编码过程二进制部分的位宽)。最后将误差值映射成正数与 k 一同输出给Golomb
18、编码模块。在正常编码模式下,制约硬件速度的是偏差参数B 和 C 进行更新时所产生的反馈回路。在 JPEG-LS 算法标准下,参数 B 和 C 的更新方式如图 2 所示。对于输入像素为 16 bit 的数据,参数 B 的更新在该流程下一个时钟周期内最多需要进行两次 18 bit 位宽的加法、三次比较和一次移位,极大地制约了硬件运行速度。但是该流程下每次 B 的更新结果只会在1N,0的范围内,这样就可以对 B 进行向前预测,在每次参数更新时对1N,0内所有的值进行更新,最后选择出正确的 B,这样可使更新 B 的反馈回路里只存在一个选择器。研究表明11,为满足绝大多数应用环境的需求,N 通常取 58
19、 位19,这就带来一个新的问题,当N 的最大值为 64 时,如果将所有 B 的可能值都进行 图 2 参数更新流程图 运算,最多需要同时对 64 个可能的 B 值进行更新,不仅会增加硬件开销,同时在后端数据选择时需要进行 64 选 1,也会限制硬件的运行速度。4.3 新的预测模块的实现 在 JPEG-LS 的参数更新流程下,对于从 B=0 到B=1N,参数更新的结果是有相互依赖关系的。求出参数 B=0 的更新结果后可以通过计算求出其他任意值的更新结果,从而减小硬件开销。使用参数 B=0 进行更新,等同于直接使用误差 E 进行更新。为了硬件实现时减少逻辑判断的复杂度,上一次 B 的更新结果用Bpr
20、e表示,E 的更新值 Eupt的相反值与 N 之间的差值用DN 表示。则 B 的更新结果 Bupt可表示为:pre pre upt pre pre pre pre upt pre upt pre pre pre upt pre pre pre1,(2)1,(2,DN),(2,DN)DN,(0,DN),(0,DN)DN,(0,DN),0,DNDN,(2,()NENNNEN BBENEN BBNEBBENEBBBEN BBEEN BBNEN B-+-+-=-+-pre DN)0,(2,DN)0,(2)NEN BNE|(1)当 N=RESET 时,只需先将 E 与 Bpre右移一位再更新即可。Eup
21、t的计算以及 E 与 N 的关系都可以放在B 的反馈回路之外进行计算。经过优化后的反馈回路,判断与加法可并行计算。对于输入位宽为 16 bit 的数据,在 RESET=64 时,改进前 B 的位宽需要 18 bit,在更新 B 时,一个时钟周期内的最大延时为 18 bit 加法的延时+18 bit 位移的延时+19 bit 判断的延时+18 bit 加法的延时。改进后的 Bpre与 Eupt都被限制在 7 bit 内,一个时钟周期内的最大延时为 max7 bit 加法的延时+7 bit 移位的延时,7 bit 判断的延时+7 bit 移位的延时,有效缩减了反馈回路内的计算延时。反馈回路的硬件结
22、构如图 3 所示。图 3 参数 B 更新反馈结构图 60 实 验 技 术 与 管 理 为进一步缩减反馈中判断逻辑的复杂度,以N_RESET_EN 单 bit 信号标志 N 是否等于 RESET 来判断,E 与 N 的关系用 Epst表示,并采取独热编码。由于 B 的更新需要提前计算好 DN、Eupt、Epst,而这些计算也是处于 C 的反馈回路中的,为了实现全流水线结构,需要对 C 的反馈回路进行处理。文献14提供了一种向前预测 C 的方式,对 C 向前预测一级,可为反馈回路增加两个寄存器而不影响数据吞吐率。但B 的反馈回路已经占用了一个寄存器,从 C 到计算出DN 等值只用一个寄存器显然是不
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 图像 实时 无损 压缩 系统 FPGA 设计 实现 张丽丽
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。