1、2023.7电脑编程技巧与维护一种典型 FC 和 CAN 偶发通信故障分析与验证花文波1,赵城慷1,赵斌1,花文涛2(1.航空工业西安航空计算技术研究所,西安710000;2.中国空空导弹研究院,河南 洛阳471009)摘要:从机载系统传感器图像到综合处理机的数据传输通信过程中,会偶发短消息指令,经机载光线通道(FC)转控制器局域网(CAN)后无响应,故障复现难度大。为了有效解决这一问题,根据产品工作原理和系统组成,对仿真验证测试系统和整机联试系统的测试覆盖性、特征参数及系统通信过程进行分析和排查,并通过加载测试工具对通信过程进行测量和验证,确定系统在初始化过程中,因上位机 FC 仿真卡没有严
2、格按照光线通道航空环境匿名用户消息协议(FC-AE-ASM)与产品建立可靠的交联通信而导致短消息无响应的偶发故障。实践表明,改进升级后的 FC 仿真卡在工程应用中有效解决了此类偶发的通信故障,提高了整机联试系统通信的可靠性。关键词:机载光线通道(FC);控制器局域网(CAN);通信故障;故障分析;验证1概述FC网络具有传输速率高、抗电磁干扰能力强、传输误码率小于10-12、拓扑结构灵活、易构建大规模分布式网络系统等特点,并支持多种上层协议和底层传输介质,在航空电子系统中已成为新一代先进综合式网络互连的首选方案之一,在F-35、B-1B等系列现役飞机中获得广泛应用13。CAN是一种多主总线系统,
3、通信速率可达1Mbit/40 m,可挂载设备达110个,在通信节点发生严重错误时具有自动关闭功能,抗干扰能力较强且节点可动态改变,差错检测和处理能力强,接口简单易于配置,满足实时性要求,是具有较大前途的现场总线之一45。在实际应用过程中,某接口模块由于同时具备FC和CAN通信功能,在随整机系统产品进行机载通信时,会出现短消息无响应的偶发故障。产品重新上、下电后,故障每23周才会偶发复现一次,在每天第1次上电时出现概率较大。由于故障随机偶发且复现难度大,涉及故障的产品数量较多、影响较大,因此迫切需要有针对性地对其进行排查、分析,根据故障发生的机理给出相应的解决方案,并进行测试验证。2系统组成及工
4、作原理2.1系统组成某接口模块主要用于实现从传感器图像到综合处理机之间的数据传输通信功能,并对内提供CAN互联接口,对外通过FC光接口,实现和综合核心处理机的点对点交联通信。它以现场可编程逻辑门阵列(FPGA)为核心,用以实现数据解析和数据格式转换,同时支持FC-AE-ASM协议和全双工通信,外围由配置电路、CAN总线接口电路、RS232接口电路、存储器电路、时钟电路、复位电路、电源电路、电转换电路组成。2.2工作原理接口模块以FPGA为核心,对外提供1路FC通信接口,同时,提供1路Camlink接收端口和1路CAN总线接口。图像接口(CamLink)电路用于从板间连接器接收4路低压差分信号(
5、LVDS)数据并转换成16位低压晶体管晶体管逻辑(LVTTL)数据传入FPGA的相应处理单元。CAN总线接口接收前端系统中各功能单元反馈的工作状态及数据信息,并将其进行数据格式转换,通过FC接口发送至FC网络,同时对FC网络中的相关数据信息完成数据解析及数据格式转换后,通过CAN总线发送至前端系统内部的各功能单元。FC流数据块消息的发送和CAN总线信息的收发均通过FPGA内部的处理器来控制和实现。3故障测量及排查3.1问题描述接口模块在随整机系统进行功能测试时,会在冷启动上电工作后,偶发短消息故障。二次加电测试时,产品短消息功能工作正常,但在正常使用12周后,会在整机第1次加电时随机偶发故障1
6、次,再次上电时,故障又长时间不复现,接口模块在仿真应用测试环境下,反复在低温-55、常温冷启动条件下加电测试,产品性能、参数一切正常,故障均不复现。3.2故障测量及排查3.2.1测试覆盖率问题测试设备内部的CamLink模块作为图像视频信号激励源,通过接口模块上的CamLink接口芯片,实现对串行高速数据的解码和转换,并接入FPGA中,由逻辑根据配置和预定时序关系完成数据采集,并通过FC接口161DOI:10.16184/prg.2023.07.0132023.7电脑编程技巧与维护转发到测试设备处理器模块,由处理器模块实现数据采集和转换,并将采集的图像数据与激励源发送图像进行比对,当数据不一致
7、时报长消息故障。短消息是由测试设备中的CAN模块作为CAN数据激励源,通过接口模块板间连接器将CAN电信号发送给接口模块CAN功能电路,再经模块上的FPGA进行数据处理后,转换成光信号发送给处理器模块;处理器模块通过光电收发器再将接收到的CAN信号与CAN激励源进行比对,输出结果。测试设备中的处理器模块就是用来模拟用户图像采集设备的,故障产品在试验室仿真测试设备中测试时,为外环测试,非模块自环测试,且串口打印有长短消息,FC功能和CAN功能测试正常,因此接口模块测试方法和测试覆盖率满足要求。3.2.2FC 总线时钟精度和稳定度测试为了排除FC总线时钟精度、稳定度因时钟边界问题而在FC频率匹配时
8、出现误码等情况,对短消息故障的7块产品与好模块进行FC时钟对比测量。从示波器测量结果来看,故障产品FC时钟的频率、稳定性与非故障模块FC时钟测试结果相比无明显差异。3.2.3冷启动的电源纹波测试在用户单位,偶发故障出现在接口模块短消息第一次冷启动或在常温第1次加电时,而不是在低温-55加电时。在模块常温和高低温摸底测试过程中,功能测试一切正常,常温测试模块供电正常,电源纹波也满足设计要求,因此未发现产品存在低温下等效电阻ESR值发生变化导致电源纹波存在超差的问题。3.2.4系统联试排查在试验室仿真环境下,产品短消息偶发故障不复现,因此,需要在整机联试现场进行故障复现和排查,接口模块在整机内的连
9、接关系如图1所示。整机系统的通信过程如下。当整机产品上电后,测试系统会进行600s的上电初始化操作。长消息的发送过程为如下。在整个初始化过程中,探测器会将探测到的图片信息经用户模块产品处理后,转换成Camlink信号,经接口模块板间连接器发给模块上的Camlink协议芯片处理,经FPGA转换处理成光信号后,再通过光纤发给上位机,待初始化完成后,上位机才能进行图像对比测试。短消息收发过程如下。在系统初始化过程中,上位机通过FC测试板卡发送短消息指令,该指令通过光纤通道经接口模块光电收发器发给FPGA进行处理后,通过CAN相关电路发送到CAN总线上;用户控制模块、旋转机构在接收到CAN总线指令后,
10、在原路返回到上位机,完成CAN总线信息的收发操作。为此进行了以下测试。(1)故障复现时,产品初始化未完成,当初始化完成后,设备旋转机构开始正常旋转,在监控界面上通过上位机发送的CAN短消息指令均无回应,示波器测量CAN收发器发送端和接收端均无波形,测量CAN控制器写信号及板间连接器CAN总线信号无波形,通过插拔光纤及软件通断光纤测试,长消息通信正常,短消息故障依旧。这说明发生故障时,模块未收到前端CAN总线上的信息。(2)针对前端仿真卡未发出CAN指令,用分析仪对上位机FC仿真卡进行加载测试,测试连接关系。对现场整机联试时用的3台测试电脑上的FC仿真卡进行测试,测试结果如下。仿真卡1:上位机端
11、口0连加载测试测试时,不能发送短消息,FC(1,1,2)端口无法上线;端口1连加载测试测试时,能上线,不能发短消息,否则软件卡死。仿真卡2:上位机端口0连加载测试测试时,能上线,也能发送短消息;端口1连加载测试测试时,不能上线。仿真卡3:上位机端口0发生故障,不可用;端口1连加载测试测试时,能上线,也能发送短消息,与产品相连时,短消息在分析仪上没有发出来。用户在使用过程中认为好的仿真卡端口为:仿真卡1的两个端口、仿真卡2的端口1、仿真卡3的端口1。结论:整机联试环境中所使用的3台上位机安装的FC仿真卡,经测试均存在故障。4分析验证4.1通信分析使用安科特纳公司提供的Load Testing工具
12、进行性能测试6,通过加载测试测量仿真卡上电瞬间,捕获短消息发送时的数据。测量结果如下:当分析仪与上位机中FC仿真卡进行端口通信时,分析仪会按照FC-AE-ASM协议发送训令。在正常工作状态下,FC端口状态机由一种protocal维持,它包含4种原语序列,分别为无操作(NOS)、离线序列(OLS)、链路复位(LR)、链路复位响应(LRR),它们分别表示发送NOS的FC端口检测到了连接失败条件或该FC端口处于下线状态等待接收OLS,发送OLS的FC端口正在执行 初始化、接收和识别图1接口模块在整机内的连接关系上位机光纤接口模块CamlinkCAN信号整机系统探测器旋转机构管理模块ICP维护1622
13、023.7电脑编程技巧与维护NOS、进入下线状态,FC端口发送LR用以执行初始化连接复位操作或从连接超时状态中恢复,FC端口正在接收和识别LR等,在进入到激活状态时,FC端口要至少发送6个IDLES,之后才能发送其他的原语序列或帧。链路上传输的原语序列不仅有NOS、OLS、LR、LRR还包括IDLES;其他信号丢失、失去同步、事件超时、连接超时、不在链路上传输,数据FC端口的监控信号。4.2验证过程在实际测量过程中,发现对于分析仪发送的NOS、OLS、LR、LRR原语,用户FC仿真卡均未进行交互响应。仅当分析仪发送IDLES后,联试系统上位机中的FC仿真卡才会响应,并开始FC通信。因此上位机中
14、的FC仿真卡在进行FC通信时,未严格按照FC标准协议进行通信,当处于LR传输状态时,在FC端口内部,BB_Credit_CNT应该被置0;当处于LR接收状态时,FC端口应处理或丢弃目前处在接收缓冲器中的帧,BB_Credit_CNT应该被清零。当连接失败时,FC端口应该更新连接错误状态块中的错误计数器,FC端口进入OLS传输状态的目的就是执行链路初始化,退出下线状态,同时执行上下线操作。因此,在初始化过程中,前端原语交互的可靠性无法得到保证,才会偶发上位机发送的FC指令无法通过FC仿真卡发送给接口模块,造成短消息通信故障。在正常情况下,分析仪会先向仿真卡发送NOS原语,表明FC端口处于下线状态
15、,仿真卡接收到NOS训令后会进行链路初始化,并接收和识别NOS,进入下线状态,并回应OLS信号。分析仪FC端口发送LR用以执行链路复位初始化操作,仿真卡回应LRR,表明正在接收和识别LR,进入激活状态,分析仪再发6个I-DLES后,在仿真卡回应IDLES后,FC端口才能发送其他的传输词。用加载测试给测试系统中的接口模块进行FC通信,捕获上电时分析仪与接口模块之间FC通信建立的原语NOS、OLS、LR、LRR、IDLES原语交互存在,说明分析仪与接口模块在FC通信过程中满足FC协议要求。在试验室仿真测试系统中,FC对比测试所采用的处理器模块主要也是由FPGA组成,逻辑测试也是严格按照FC-AE-
16、ASM协议进行,在仿真系统验证测试时,FC通信是按照FC协议进行的,因此故障不会复现。4.3分析结论在整机系统联试过程中,当短消息故障复现时,通过分析仪分别捕获与联试系统上位机FC仿真卡、整机测试系统中产品FC通信前建立的原语,根据FC通信的工作原理,可以确定故障原因是上位机中FC仿真卡没有严格按照FC-AE-ASM通信协议进行通信交联响应。在IDLES原语之前发送的NOS、OLS、LR、LRR原语,因为FC仿真卡没有响应,所以FC通信建立过程存在不确定性,可靠性存在不足,最终导致整机测试系统在初始化过程中会偶发FC通信建立失败故障。上位机发送的短消息指令经FC仿真卡处理时无法正确发送出去,因
17、此接口模块CAN短消息接收和发送均无信号,串口无输出,短消息功能没有响应。在仿真测试系统试验验证过程中故障不复现,是因为仿真测试系统中所使用的处理模块是以FPGA为核心搭建的,并且在FC通信过程中,也是严格按照FC协议进行通信的。因此整个FC通信过程是确定的、可靠的。5解决措施整机联试系统中的FC通信要严格按照FC协议进行,通过升级上位机系统中的FC仿真卡,使之按照FC-AE-ASM协议进行通信,可有效解决FC转CAN过程中偶发的短消息故障。实践证明,通过改进升级后的FC仿真卡,在系统联试过程中,之前批量出现的偶发短消息故障消失,装备可靠性得到提高。6结语针对系统联试中出现的一类FC转CAN偶
18、发短消息故障,从模块组成、工作原理、仿真测试试验验证系统的测试覆盖性、特征测试及系统联试通信过程方面进行分析和测量,确定因上位机中FC仿真卡工作异常而导致通信报故的原因。通过分析仪的加载测试工具,分别对FC仿真卡和模块端进行了详细测量,确定FC仿真卡故障是因为FC通信过程中交联建立的FC协议原语有缺失,FC通信建立过程存在不确定性,仿真卡没有严格按照FC协议进行通信,导致在系统初始化过程中CAN指令没有得到响应,出现通信报故。改进升级之后,系统可靠性得到明显提高,在工程应用中具有较强的指导意义。参考文献1韩强.基于PCI-E交换的多接口模块设计J.信息通信,2018(5):64-65.2李键,
19、孙东旭,朱志强.航电FC交换网络可靠性建模与仿真研究J.电光与控制,2019,26(5):73-76.(下转第166页)1632023.7电脑编程技巧与维护3孙东旭,贾世伟,孟玉慈,等.综合模块化航电系统FC网络的机内测试设计J.航空计算技术,2016,46(6):108-112.4徐志山.基于CAN总线的开关控制电路设计与实现J.西安文理学院学报,2018,21(2):44-49.5李瑞金.基于CAN总线的网络通信信道的建模与研究J.测控技术,2018,37(7):9-13.6张庆松.航空电子系统光纤通道性能研究J.重庆理工大学学报,2017,31(8):145-149.(上接第163页)主
20、要进行了界面布局设计,执行框体设计与通过MQTT协议的软硬互联。设置单击卡片的方法,发送字符串指令,通过MQTT与云平台连接,将指令下发到硬件,并作出相应的反应。使用JavaScript脚本语言汇编设计窗体,其中包括窗体设计中的各个元素、窗体框架等。设计以两个充电设备为基础模型,在界面上可以看到两个可执行框体,用户可以单击框体即可进行充电控制。项目开发的AIR724UG负载控制系统是一个典型的单片机系统。设备的一个重要特点是硬件和软件的精确集成。因此,在负载控制系统的设计过程中,首先要对设备进行查找和测试,然后对软件进行故障排除和测试。两者相互独立、相互联系。调试功能清单如表1所示。打开控制界
21、面,单击1号机,可听到语音提示“1号机开始充电”,发光二极管(LED)显示屏上电流值增加,设置为充满状态时,10 s后自动停止充电,也可手动单击停止充电,LED显示屏上的电流值恢复,可听到提示音“1号机充电完成”;单击2号机,可听到语音提示“2号机开始充电”,LED显示屏上电流值增加,状态为持续充电状态,并10 s检测一次电流,手动单击停止充电,LED显示屏上的电流值恢复,听到“2号机充电完成”。系统实物如图2所示。4结语设计采用了低功耗、高性能的主控芯片,用户可以通过4G网络随时检查充电情况并控制充电结束,提供了更加安全的充电环境;系统具有自我保护功能,可以在异常情况下进行自我断电,全力保障
22、用户的生命和财产安全。操作过程全程语音提示,简单易懂,能够为用户提供更加友好的充电服务。参考文献1李秀娟我国新能源技术产业发展现状与对策探讨J 黑龙江科技信息,2008(30):592王晓宁中国新能源发展现状与趋势J 高科技与产业化,2008(1):60-623沈苏彬,范曲立,宗平,等物联网的体系结构与相关技术研究J 南京邮电大学学报(自然科学版),2009,29(6):1-114张应福物联网技术与应用J 通信与信息技术,2010(1):50-535朱洪波,杨龙祥,朱琦物联网技术进展与应用J 南京邮电大学学报(自然科学版),2011,31(1):1-96毕道治 21世纪电池技术展望J 电池工业
23、,2002(3):205-2107毛国龙锂离子动力电池发展现状及应用前景J 中国电子商情(基础电子),2009(8):14-148左俊平.基于物联网技术的电池组远程监测系统设计D.哈尔滨:哈尔滨理工大学,2014.9雷晶晶,李秋红,陈立宝,等动力锂离子电池管理系统的研究进展J 电源技术,2010(11):1192-119510朱嘉宁.基于物联网技术的动力锂电池远程监测系统设计D.杭州:中国计量大学,2019.名称期望结果AIR724UG保证模块正常运行4G指示灯亮电源提供稳定电压可见稳定5 V电压电能计量监测监测电流电压每隔10 s成功监测硬件与软件通信数据传输准确成功通过软件控制软件显示显示数据成功显示充电时长表1调试功能清单图2系统实物166