1、收稿日期:2022-07-05基金项目:2022 陕西省哲学社会科学重大理论与现实问题研究项 目 传 播 学 视 阈 下 的 终 南 文 化 术 语 英 译 研 究(2022ND0168);2022 西安市社会科学规划基金项目“中国梦”在陕西乡土文学中的历史探索与启示(22LW192)作者简介:刘佳(1981-),女,山东平度人,英语语言文学硕士、在读博士,副教授。基于机器学习的英语翻译机器人异常智能诊断模型构建及仿真刘 佳(西安翻译学院,西安 710105)摘 要:针对英语翻译机器人在出现故障时诊断反馈速度慢且准确度不高的问题,基于机器学习的方法提出一种异常智能诊断模型。仿真实验结果表明,加
2、入动态时间步改进方法以及 RF-GBDT 特征选择算法的 LSTM 神经网络故障诊断模型在进行异常诊断时反馈速度快且准确度得到了提高。相较于未经特征的故障诊断模型,基于 RF-GBDT 特征选择算法的故障诊断模型在进行特征选择时准确率均得到了提升,而经过动态时间步改进的 LSTM 神经网络故障诊断模型相比于未改进前,数据分类准确度提高到了 93%,每帧序列数据计算时间步长减少了 39%,经过最后的故障诊断系统测试,证明了设计的诊断模型具体有较高的准确性和实用性。关键词:机器学习;故障诊断;随机森林算法;梯度提升度算法;LSTM 神经网络 中图分类号:TP392 文献标识码:A DOI 编码:1
3、0.14016/ki.1001-9227.2023.01.241Construction and Simulation of abnormal intelligent diagnosis model for English translation robot based on machine learningLIU Jia(Xian FanYi University,Xian 71015,China)Abstract:In order to solve the problem that the feedback speed of English translation robot diagno
4、sis is slow and the ac-curacy is not high,an abnormal intelligent diagnosis model based on machine learning is proposed.The simulation results show that the fault diagnosis model of LSTM neural network with dynamic time step improvement method and rf-gbdt feature selection algorithm has fast feedbac
5、k speed and improved accuracy in abnormal diagnosis.Compared with the fault diagnosis model without features,the fault diagnosis model based on rf-gbdt feature selection algorithm has improved the accuracy of feature selection.Compared with the fault diagnosis model without features,the LSTM neural
6、network fault diagnosis model improved by dynamic time steps has improved the accuracy of data classification to 93%and the calculation time step of each frame sequence data has been reduced by 39%.After the final test of the fault diagnosis system,It is proved that the designed diagnosis model has
7、high accuracy and practicability.Key words:machine learning;fault diagnosis;random forest algorithm;gradient lifting degree algorithm;LSTM neural network.0 前言随着人工智能的兴起,各类型的机器人的出现也络绎不绝,而机器人的故障问题也随之出现。目前,已出现较多的机器人异常诊断模型的设计,缪昭明等基于时间序列关联特征的故障诊断方法,构建了一种 SE-CNN 模型,提出了一种基于 SE-CNN 的服务机器人运动系统云端故障诊断方法1;潘屹豪等提出
8、一种基于改进一维卷积神经网络的多轴工业机器人故障诊断模型正交正则化一维卷积神经网络(SRIPCNN-1D),仿真结果证明该网络能够完成机器人的故障诊断2;方烜等针对一般BP 神经网络诊断模型存在着收敛速度较慢,易陷入局部最优,诊断准确率偏低的缺陷,利用 IGWO-BP 的权值与阈值,提出基于改进灰狼算法-BP 神经网络的智能巡检机器人电磁兼容故障诊断,提高了故障诊断准确率3。翻译机器人作为服务性机器人中的一大类,也会面临着异常诊断的问题,因此,针对英语翻译机器人在运行过程中所出现的各种移动故障问题,提出一种基于机器学习的英语翻译机器人异常诊断模型,将 LSTM 神经网络作为基础诊断模型,加入动
9、态时间步改进方法和RF-GBDT 特征选择算法,提升英语翻译机器人的异常诊断水平。1 基本结构和算法1.1 LSTM 神经网络服务型机器人在工作时所获取的数据信息有其独特所在,通过传感器的信息采集,获取到的数据具有时142自动化与仪器仪表2023 年第 1 期(总第 279 期)序性,而建立的时序模型能够采集到所获取的数据的时序特征。英语翻译机器人也是属于服务型机器人的一类,由于其自身在数据获取上的独特性使得英语翻译机器人的异常诊断研究更具有优势。深度学习算法中的 LSTM(Long Short-Term Memo-ry)神经网络是为了解决 RNN(Recurrent Neural Net-w
10、orks)网络长期依赖而改进的一种特殊的 RNN 网络4-6。因此,LSTM 神经网络同样具有 RNN 网络对于时序数据信息的保留功能,其结构如图 1 所示。图 1 LSTM 结构图上图中,状态 Ct和 Vt被同时传送,负责实现传输状态更新任务的门控单元 ft、it、ot之间存在着计算关系:ft=(Wf ht-1,xt+bf)it=(Wi ht-1,xt+bi)ot=Wo ht-1,xt+bo()(1)图 1 中其他参数,过渡的细胞单元更新Ct=tanh Wc ht-1,xt+bc()(2)新传输状态:Ct=ftCt-1+itCht=ottanh Ct()(3)结构对应输出:yt=Wyht+b
11、y()(4)同时,LSTM 网络能够对传统RNN 网络存在的数据梯度消失问题发挥抑制作用,该功能使得其在语言建模、数据分析以及文本识别等方面得到了广泛应用,同样使得其能够应用于英语翻译机器人的异常诊断模型构建。1.2 RF-GBDT 特征选择算法故障诊断模型需要对输入的英语翻译机器人故障时间序列信息进行特征提取。因此,在网络结构设计的基础上,还需加入一个算法实现异常特征的提取。在通常的故障特征提取的设计中,使用最多的算法为随机森林算法(Random Forest,RF)以及梯度提升树算法(Gra-dient Boosting Decison Tree,GBDT)7-9。前者在进行异常诊断时,主
12、要是为了达到降低模型方差以及优化过拟合程度的目的;后者则是将重心放在减少模型偏差同时提升其准确度的方向上,但该方法的缺点在于存在经常性的过拟合情况。而需要注意的是,模型的传感器部分采集到的数据以及该数据对应的后向差分数据在进行模型的异常诊断分析中并不是所有信息都与模型的异常状态存在关联,这些无用数据的存在在进行数据处理的时候只会起到干扰作用。在重要特征变量作用于系统时,这些无用数据会造成数据的混淆,进而降低系统的异常诊断水平,并且由于系统对于数据无法辨别,便会对数据无差别处理,这就造成了计算机资源的浪费同时延长了数据处理时间,进而使得异常诊断的实时性无法得到保障。为了消除无用数据的影响,需要通
13、过计算将重要特征变量进行筛选,通过数据的筛选便能较大程度上提高系统异常识别的准确度同时也能保证异常诊断的实时性。因此,故障特征选择在整个异常诊断模型的设计中显得尤为重要。针对上述问题,提出 RF-GBDT 特征选择算法,该算法是基于 RF 算法以及 GBDT 算法融合而成的,该算法在进行故障特征选择时不仅能够实现单个的 RF 或者 GBDT 算法的功能,还能实现多个算法联合的故障特征选择10-11。2 基于 RF-GBDT 算法的 LSTM 神经网络异常诊断模型构建2.1 故障特征提取模型构建构建 M 个随机模型,M/2 个为 RF 模型,M/2 个为GBDT 模型,为使得重要特征能够更加准确
14、且简洁地进行表达,使用加权融合的方法将上述的全部模型的分类准确率进行融合,最终得到所有特征的加权重要性为:FIj=M2mAR()mFI(R)mn+M2nA(G)mFI(G)mn(5)式中,AR()m为 RF 模型第 m 个模型准确率,FI(R)mn为特征n 在 RF 第 m 个模型中的特征重要性,AG()m为 GBDT 模型中第 m 个模型准确率,FIG()mn为特征 n 在梯度提升模型中第 m 个模型中的特征重要性。式(5)的表达可以再次进行精简,因此,再将其实施标准化操作得:FINJ=FIidIFIi(6)设计的经过算法融合后的故障特征选择模型基于RF-GBDT 融合得到的故障特征选择模型
15、同时具有 RF模型的低方差优点和 GDBT 模型的低偏差优点。经过融合后的特征重要性在可信性上依然存在着提升空间,在进行多个特征重要性融合的过程中,融合系统会根据模型的异常分类精度进行划分,精度水平高的对应的特征重要性比重也会高,水平低的对应比重也会低,而经过融合之后的特征重要性构成是综合多方面考虑的。2.2 基于动态时间步的 LSTM 神经网络故障诊断模型构建在进行故障诊断模型的设计时,传统的 LSTM 神经网络如果直接用于建立英语翻译机器人异常诊断模型,将无法避免时间步对于设计中时序模型的影响,因此,应对 LSTM 神经网络进行时间步上的优化设计,以此提高异常诊断模型的诊断效果。2.2.1
16、 时间步对 LSTM 网络的影响LSTM 神经网络是以时间步作为单元状态区分的依242基于机器学习的英语翻译机器人异常智能诊断模型构建及仿真 刘 佳据,神经网络获取到的数据的序列长度不同,对应的时间步也不同,容易得知时间步越长,模型的训练效果也会更好12。虽然 LSTM 神经网络的时间步长度要增长是十分容易的,但时间步过长也会造成训练效率降低以及信息丢失的问题,即使神经网络本身具有对梯度消失问题的抑制功能,但达到一定数值后依然会给模型的训练带来各种问题,相反的,时间步过短会使得训练所需的数据量不足,还有可能导致时序性的丢失。因此,在进行时间步长选择时应综合考虑各方面因素,在考虑到时间收益和效率收益的同时,应使得设计的时间步长保证模型能够在此过程中获取到足够的信息。2.2.2 动态时间步方法在英语翻译机器人异常诊断模型的建立过程中,通常使用滑动窗口的方法获取故障数据时间步长,通过模型训练后再筛选出表现最好的样本,该样本则为最终得到的时间步长,但该方法存在的弊端是效率低下以及计算量过大13。在进行英语翻译机器人进行异常诊断时,由于机器人活动的多样性,采集到的信息不能保持稳定。在模型中,不同