1、收稿日期:2021-07-31修回日期:2021-09-25基金项目:军事类研究生资助课题(JY2019C213)作者简介:钱昭勇(1987-),男,四川遂宁人,博士研究生。研究方向:装备试验。*摘要:对于在轨卫星的在役考核,其质量稳定性是一项非常关键的指标。一个重要的途径就是通过对在轨卫星的工作状态及健康状况保持持续监控和记录,充分利用历史各种类型的遥测告警数据,进行相关性检验,判断哪些类型的告警与对应卫星分系统的真正故障紧密相关。构建时间序列 ARMA 模型预测相关类型的告警情况,采用支持向量机(SVM)和随机森林(RF)等预测模型进行分类判断,进而预测在轨卫星是否发生某具体类型的故障,为
2、检验考核卫星系统或部件质量稳定性提供参考方式。关键词:数据挖掘,在轨卫星,在役考核,时间序列,故障预测中图分类号:E92文献标识码:ADOI:10.3969/j.issn.1002-0640.2022.11.027引用格式:钱昭勇,曹裕华,史增凯,等.基于数据挖掘的在轨卫星故障预测分析 J.火力与指挥控制,2022,47(11):164-169.基于数据挖掘的在轨卫星故障预测分析*钱昭勇1,曹裕华2,史增凯1,张雷3(1.航天工程大学,北京101416;2.国防大学联合勤务学院,北京100858;3.西安卫星测控中心,西安710043)Fault Prediction and Analysis
3、 of On-orbit SatellitesBased on Data MiningQIAN Zhaoyong1,CAO Yuhua2,SHI Zengkai1,ZHANG Lei3(1.Space Engineering University,Beijing 101416,China;2.Joint Service College,National Defence University,Beijing 100858,China;3.Xi an Satellite Control Center,Xi an 710043,China)Abstract:For the in-service as
4、sessment of on-orbit satellites,the quality stability is a veryimportant index.An important way is continuously monitoring and recording the working state and healthstatus of the on-orbit satellites,making full use of various types of historical telemetry alarm data,conducting the correlation test,a
5、nd judging which type of alarm is closely related to the real fault of thecorresponding satellite subsystem.The time series model ARMA is constructed to predict the relevanttypes of alarm conditions,then such prediction models as support vector machine(SVM)and randomforest(RF),etc.are used for class
6、ification and judgment,and whether a specific type of fault occurs inthe on-orbit satellites is predicted.It provides a reference method for the inspection and assessment ofthe quality stability of satellite system or components.Key words:data mining,on-orbit satellite,in-service assessment,time ser
7、ies,fault predictionCitation format:QIAN Z Y,CAO Y H,SHI Z K,et al.Fault prediction and analysis of on-orbitsatellites based on data miningJ.Fire Control&Command Control,2022,47(11):164-169.0引言卫星是一个非常复杂的综合系统,按照结构组成通常分为载荷分系统、数管分系统、数传和测控分系统、电源分系统、热控分系统、控制分系统(包括姿态控制和推进分系统)等。在轨卫星运行过程中,由于受空间环境(强辐射、超低温、高速
8、尘埃等)无规律变化的影响,系统或部件产生的故障具有故障原因错综复杂、故障时间难以预计、隐患损失后果严重等特点。为加强卫星健康管理,保障在轨卫文章编号:1002-0640(2022)11-0164-06Vol.47,No.11Nov,2022火 力 与 指 挥 控 制Fire Control&Command Control第 47 卷第 11 期2022 年 11 月164(总第 47-)星正常运转,通过故障预测检验考核在轨卫星质量稳定性,已经成为对其在役考核的一个重要研究方向。文献 1 立足国内外低轨遥感卫星设计寿命和在轨故障情况的统计分析,结合运行轨道、空间环境、任务要求等特点,梳理出了影响
9、低轨遥感卫星寿命的设计薄弱环节。随着在轨卫星遥测参数和各种卫星管理数据的不断积累,基于数据挖掘的卫星故障预测与健康状态评估方法,通过综合运用统计学和机器学习相关模型,以数据的科学分析处理为视角,既克服了专家故障预测判断的主观性太强,又对环境噪声的敏感度较低,已逐渐成为目前的研究重点。文献 2 在把握数据挖掘和在役考核的内涵基础上,针对装备寿命周期的数据特征,介绍了数据挖掘的预处理、挖掘实施和结果,解释 3 个阶段在装备在役考核中的应用形式,全流程分析了基于数据挖掘技术的装备在役考核评估程序,并给出了数据挖掘在在役考核中选择应用工具与算法的思路。文献 3 针对卫星参数类型多,数据维度高的情况,在
10、特征提取后使用 K 近邻(KNN)算法进行测试,采用核主成分分析(KPCA)方法对故障进行检测,并通过粒子群优化算法(PSO)选取支持向量机(SVM)参数惩罚因子以及径向基函数核参数,重点分析了动量轮和陀螺等卫星关键部位的故障机理。文献 4 针对在轨卫星故障诊断后验证知识获取困难,在轨运行中功能或性能退化导致门限诊断精度下降等问题,介绍了一种基于决策树的卫星故障诊断知识挖掘方法。文献 5 通过对比分析了基于规则驱动和基于数据驱动的两种故障预测方法,利用知识图谱和深度学习,实现了对故障器件剩余使用寿命和故障发生原因等方面预测。文献 6 为解决在轨卫星多任务故障预测问题,提出了结合长短期记忆网络(
11、LSTM)和卷积神经网络(CNN)的数据挖掘模型。考虑到在轨卫星管理过程的各种统计数据不易搜集整合,文献 7 介绍了装备体系鉴定仿真试验床的基本特征和功能,引入智能引擎,可为仿真模拟在轨卫星故障提供数据和环境支持。综上所述,由于各个分系统遥测参数的告警数据是在轨卫星健康状态和运行情况的最直接反映,因而可以通过对各个分系统历史故障告警数据进行相关性检验,找出真正与故障相关的告警类型,然后使用时间序列 ARMA 模型进行告警情况预测,并通过分类算法进行相应的故障诊断,不仅考核在轨卫星各分系统的性能,同时也能对各种故障类型进行分类诊断,提前预判并做好相应准备,对保证在轨卫星的可靠性与时效性有积极意义
12、。1分析过程与方法1.1总体流程在轨卫星系统出现故障常常是一个渐变的过程,各种故障的出现随时间的推移存在较强的关联性,且历史的遥测告警数据对未来的发展存在一定的影响,因而可以通过时间序列分析对下一步的告警情况进行预测分析。其挖掘建模的总体流程,如图 1 所示。图 1基于时间序列故障预测总体流程图首先,从遥测参数数据库中有选择性地抽取历史数据,对抽取的数据进行周期性分析以及数据清洗、数据变换等预处理操作;接着,通过相关性检验,判断并形成与系统故障紧密相关的告警建模数据;然后采用时间序列分析法进行模型的构建,使用移动平均平滑、指数平滑等预测方法进行对比分析,得到可信的时间序列模型预测告警情况;最后
13、通过支持向量机、随机森林等分类模型,判断预测系统故障情况。1.2选用模型介绍1)指数平滑预测模型:通过计算指数平滑值,配合一定的时间序列预测模型对现象的未来进行预测8。(1)其中,表示权重因子。2)ARMA 模型:由 AR 模型和 MA 模型组合构成。AR 模型表达式为:(2)其中,为自回归系数,t是随机部分,表示误差或残差项。MA 模型表达式为:(3)其中,t与前面相同是随机误差,而为各阶的预测误差,为平滑系数。ARMA 模型随机变量 Xt的取值不仅与前 p阶的序列值有关,还与前 q 阶的随机扰动有关,其表达式如下:(4)钱昭勇,等:基于数据挖掘的在轨卫星故障预测分析1652019(总第 4
14、7-)火 力 与 指 挥 控 制2022 年第 11 期由于 ARMA 模型适用于平稳的时间序列,当告警时间序列为非平稳序列时,可进行差分,差分后常常会显示出平稳序列的性质,称这个非平稳序列为差分平稳序列9。差分后的平稳序列可以使用ARMA 模型分析。3)支持向量机(SVM)模型:设线性样本集(xi,yi),i=1,n,xRd,y+1,-1为类别符号。d 维空间中线性判别函数的一般形式为,w 代表空间权向量;b 代表阈值。要使分类线对所有样本正确分类,就需要分类间隔最大,即最小10,且满足:(5)对于线性不可分样本集,可引入核函数把输入向量映射到高维特征空间,从而使样本在特征空间内线性可分。多
15、项式核函数:(6)其中,q 是多项式的阶。径向基函数(RBF):(7)Sigmoid 核函数:(8)4)随机森林(RF)模型:首先使用 Bootstrap 方法从原始训练集随机抽取 K 个样本集;然后给每个训练样本集分别构建决策树模型,得到 K 种分类结果;最后根据 K 种分类结果对每个记录进行投票表决,从而得到最终分类11,如图 2 所示。图 2随机森林组成模型1.3相关性分析遥测参数告警并不一定意味着系统故障的真实发生。例如,数传和测控分系统、载荷分系统、数管分系统等相对更容易受到复杂电磁环境变化的影响,出现“虚假”告警;电源分系统、推进分系统、热控分系统等。在生命周期里,保证能源供给充足
16、的情况下,告警频率相对较少,即使出现告警,多为误报,毕竟这几个分系统更依赖于消耗性能源供给,一旦真正出现重大故障几乎便是灾难性的。遥测告警数据在短期时间里变化不明显,为便于后续分析处理,此处选取的告警数据是结构化的,数据提取过程就在源系统数据库内执行,采用完全提取法,按照一定的时间间隔,对卫星系统各遥测参数的告警记录进行抽取,几乎无需跟踪更改,逻辑更加清晰简单,采到的样本不用考虑信息损失,也不存在信息冗余。为此,在预测系统故障时,必须进行各分系统参数告警与系统故障的相关性检验,从而选取相关性最强的变量进行进一步分析预测。皮尔逊相关系数记作 rXY,其计算公式为:(9)式中,xi为各分系统告警数(自变量)的实际值;i1,2,n;X?为自变量平均值;yi为系统故障情况(因变量)的实际值;Y?为因变量的平均值;n 为项数。2时间序列模型构建2.1告警与故障相关性检验以某型卫星遥测告警历史统计情况的仿真数据(以周为单位,此处选取 35 周)为例,进行建模和比较分析。为便于对模型进行评价,将经过数据预处理后的建模数据划分为两个部分:一部分为建立模型的样本数据;另一部分为模型的预测验证数据。首先进