基于DWT与SVM的风门开闭阶段识别方法

资源描述

1、第卷第期年月中国安全科学学报中文引用格式：邓立军，尚文天，刘剑，等基于与的风门开闭阶段识别方法中国安全科学学报，（）：英文引用格式：，（）：基于与的风门开闭阶段识别方法邓立军，副教授，尚文天，刘剑，教授，周煜凯，宋莹（辽宁工程技术大学安全科学与工程学院，辽宁葫芦岛；辽宁工程技术大学矿山热动力灾害与防治教育部重点实验室，辽宁葫芦岛；山东工商学院管理科学与工程学院，山东烟台）中图分类号：文献标志码：.基金项目：国家自然科学基金资助（）；山东省自然科学基金资助（）。文章编号：（）；收稿日期：；修稿日期：通信作者：尚文天（），男，内蒙古赤峰人，硕士研究生，研究方向为矿

2、井智能通风与异常识别。：。【摘要】为解决因风门开闭导致的风速传感器数据异常波动与误报警问题，提出一种基于离散小波变换（）与支持向量机（）的风门开闭阶段识别方法。使用多尺度滑动窗口将传感器风速监测数据离散化为若干段不同尺度的子时间序列数据，利用统计方法与，提取各尺度子时间序列数据中的统计特征与隐含的波动特征，建立风门开闭阶段识别分类模型。为进一步优化识别结果，基于重叠度（）规则合并、修正、组合、取优分类识别结果，再根据相似准则建立长度方向取变率为、整体相似比为的相似试验模型，开展风门开闭扰动试验，验证方法的可行性。结果表明：在测试集上的识别准确率较高，对于风门开闭时间的识别准确率可达到.，

3、风门开闭阶段的划分准确率可达到.，优化滑动窗口尺度数量，可继续增加方法识别的准确率。【关键词】离散小波变换（）；支持向量机（）；风门开闭；阶段识别；多尺度滑动窗口；重叠度（），（，；，；，）：，中国安全科学学报第卷年，.，.：（）；（）；（）引言矿井风门开闭是一个动态过程，在湍流与风门开闭运动的耦合作用下，部分关联巷道内风速变化幅度可达到，甚至会导致部分巷道内风流反向。传统统计方法并不能明确风门开闭与关联巷道内风速异常变化之间的关系。通过风速传感器监测数据有效快速识别风门开闭各阶段，可以明确风速传感器数据异常变化是由风门开闭引起的，从而降低风速传感器误报警的发生概率，提高矿井监测监控系统

4、的稳定性。风门开闭会导致风速数据产生强烈波动，这种波动类似于电能质量信号扰动、语音信号波动。国内外学者在电能质量信号扰动检测、噪声环境下语音信号波动识别方面提出诸多有效的识别方法。在电能质量信号扰动识别方面，熊兴隆等应用导数分析与典型特征选取对机场环境光纤预警系统所监测到的信号中的异常波动进行采样与特征提取，构建了概率神经网络识别模型；等利用一维和二维卷积神经网络，分别提取电能质量原始信号及图像中的隐含特征，并合并提取到的特征向量，再进行全连接层识别与分类。除此之外，径向基函数神经网络、稀疏自动编码器神经网络、极限学习机与概率神经网络、学习向量量化神经网络、极限梯度提升等方法，也具有较高的扰动

5、识别准确率。在语音信号识别方面，黄鸿铿等使用尺度的小波包分解声音信号，再使用分解系数生成重构信号的频谱，通过随机森林（，）分类器实现不同场景下低信噪比动物声音的识别；王若平等采用小波包去噪减少交通环境的噪声，提取梅尔频率倒谱系数作为特征，并采用支持向量机（，）完成对声音事件的识别。除此之外，还有深度置信网络、一维卷积神经网络和长短期记忆也取得了较高的目标声音识别准确率。但以上算法仅在能质量信号扰动识别、语音信号波动识别领域具有较好效果，不能直接应用在矿井通风领域。综上，应用、神经网络等人工智能方法可有效实现各类数据波动识别。因此，针对风门开闭阶段识别问题，提出一种基于离散小波变换（，）与的

6、风门开闭阶段识别方法，使用多尺度滑动窗口将连续风速监测数据离散化，利用提取离散数据隐含特征，建立风门开闭阶段识别模型，并基于重叠度（，）规则合并、修正、组合、取优识别结果，再开展相似试验，验证方法的可行性，以期达到较高的风门开闭阶段识别准确度。风门开闭阶段识别方法风速开闭阶段识别问题的本质为非平稳的时间序列数据分类问题。文中提出一种基于与风门开闭阶段识别方法，共分为个步骤：步骤：风门开闭时间范围识别。采用离差标准化将原始监测数据归一化，并使用滑动窗口方法将归一化处理后的连续监测数据离散化，离散化得到的子时间序列数据分属于风门开闭时间类别或正常时间类别（

7、除风门开闭外的其他时间）；再通过提取子时间序列数据中的隐含特征，生成风门开闭阶段分类识别数据样本，构建风门开闭阶段分类器模型。为进一步提高风门开闭阶段的识别准确率，训练多个不同滑动窗口尺度的风门开闭阶段分类器，合并修正分类结果，基于值选取最优时间组合，构建风门开闭时间范围段识别模型，识别第期邓立军等：基于与的风门开闭阶段识别方法风门开闭对应的时间范围。步骤：风门开闭阶段识别。风门开闭过程包括风门开启阶段、风门敞开阶段、风门关闭阶段。其中，风门开启阶段是指风门从开启到指定角度的过程；风门敞开阶段是指风门保持指定角度持续敞开的过程；风门关闭阶段是指风门由指定角度到完全关闭的过程。将原

8、始监测数据中的若干段正确风门开闭过程的时间序列数据与步骤识别得出的风门开闭过程的时间序列数据作为新的监测数据，重复步骤，构建出可以识别风门敞开阶段对应的时间范围的模型后，再通过风门开闭整个过程与风门敞开时间的个时间序列划分风门开闭阶段，形成风门开闭阶段识别模型。具体流程如图所示。关键技术包括：多尺度滑动窗口离散化；基于的特征提取；风门开闭阶段分类器；基于值单长度最优时间序列选取；基于值的全长度时间组合排序。图基于与的风门开闭阶段识别方法流程 .多尺度滑动窗口离散化风速传感器监测数据属于连续时间序列数据，故要进行离散化处理，并将离散化后的子时间序列数据做二分类划分，作为后续

9、风门开闭阶段识别分类器模型的样本。为减少分段造成的数据信息缺失，采用滑动窗口方法提高采样频率，取滑动步长为窗口尺度的一半。受湍流与入口风速、风门开闭速度、开闭角度、敞开时间等因素的影响，风速数据波动的出现时间、持续时间、波动幅值等具有不定性。固定的滑动窗口尺度无法保证采样数据包含足够的因风门开闭产生的风速波动特征。以尺度与的滑动窗口为例，离散化过程如图所示。由图可知：大尺度滑动窗口离散化出的子时间序列数据保留了更多数据的连续性，但小尺度滑动窗口划分得更加精确。故使用不同尺度滑动窗口进行多次离散化，并合并修正不同尺度的识别结果，可提高最终识别的准确率。考虑到矿井风门开闭的持续时间较短，且

10、矿井监测监控系统巡检周期不得超过。因此，设定滑动窗口尺度规则为：）最大滑动窗口尺度需保证滑动窗口在单一巡检周期内滑动，窗口至少应包含个以上数据才可进行具有重叠区域的滑动，故选取最大尺度为中国安全科学学报第卷年图与尺度滑动窗口离散化过程，最小尺度为。）当滑动窗口在监测数据中的最后一次滑动并不能做到完整滑动步长时，滑动至可滑动的最大距离即可。.基于的特征提取对于任一由.小节离散化后的子时间序列数据，其特征由统计特征与波动特征部分构成：（）式中：为特征；为统计特征；为波动特征。）统计特征。（，）（）式中：为子时间序列数据的平均值；为子时间序列数据的极小值；为子时间序列数据的极大值

11、；为子时间序列数据的方差。）波动特征。利用进行离散变换，将原始数据分解为若干层，每层由高频系数与低频系数构成。通过计算多层分解所得的高频或低频系数的能量熵得到波动特征，计算方法如下：，（）式中：为第层的低频系数能量熵；为第层的高频系数能量熵；，为第层第个低频系数；，为第层第个高频系数；为第层低频系数的总数；为第层高频系数的总数。因采用最小滑动窗口的尺度为，为使每段数据都可被小波分解至少一次，采用滤波器长度为的小波，分解层数计算方式为：（）式中：为可分解的层数；为子时间序列数据长度。通过式（）、式（）可知：针对长度不同的各组子时间序列数据，其波动特征的数量为，则每段数据的

12、波动特征构成如下式：（，）（）式中：为第一层低频能量系数熵和；为第一层高频能量系数熵和；为第层低频能量熵和；为第层高频能量熵和。以长度与的子时间序列数据为例，其子时间序列数据特征对比见表。由表可知：基于提取出的波动特征具有显著的差异性，能够提升分类器样本质量；数据长度越大，能提取出的特征越多，可以提高识别的准确率。表与长度的子时间序列数据特征对比长度图形类别正常通风时间.风门开闭时间.正常通风时间.风门开闭时间.风门开闭阶段分类器采用.与.小节方法将风速传感器连续监测数据按不同尺度进行多次离散化以及特征提取，建立各尺度风门开闭阶段分类器模型。采用方法建立分类模型，核函

13、数采用高斯径向基（，）函数。在每一段监测数据中，属于正常通风类别的数据数量明显大于属于风门开闭类别的数据，故应欠采样分类模型的训练样第期邓立军等：基于与的风门开闭阶段识别方法本，保证样本均衡性，保证用于训练分类模型的正常数据与异常数据比例为。分类效果如图所示。图长度与子时间序列数据分类结果 .基于值单长度最优时间序列选取方法 .小节风门开闭阶段分类器模型的识别结果仅是不同长度、不同类别的离散子时间序列数据，故需将所需类别的离散子时间序列数据合并为连续时间序列数据。在合并为连续数据后，可能存在单一长度离散数据的合并结果中存在个及以上的连续时间序列数据，为排除错误的连续

14、时间序列数据，故要基于值选取单长度最优时间序列，其中，值为重叠度评判标准，代表个时间序列向量的重叠度，其计算式为（）（）（）式中：为时间序列；为时间序列。基于值单长度最优时间序列选取步骤如下：步骤：按照下式将小于所需类别最短时长的连续时间序列剔除。（）式中：为时间序列；为所需类别最短时长；为所需类别；为无关类别。步骤：在剔除所有小于所需类别最短时长的连续时间序列后，当某一长度的连续时间序列数量为时，将其作为该长度最优时间序列；当某一长度的连续时间序列数量为时，将该长度最优时间序列设置为，；否则进入步骤。步骤：按照下式计算该长度的每个时间序列与经步骤选取出的其他长度时间序列的平

15、均值，并选取其中平均值最大的时间序列作为单长度最优时间序列。（）（）（）式中：为长度时间序列中第个时间序列与其他长度时间序列的平均重叠度；为时间序列各长度的数量；为长度时间序列数量；为第长度的第个时间序列；为长度的第个时间序列。假设所需类别最短时长为，某一个长度有个时间序列，其中，为，为，为，将时长小于所需类别最短时长的剔除，根据式（）计算、的平均值，选取平均值较大的为该长度时间的最优时间序列。.基于值的全长度时间组合排序方法根据.小节所述方法处理后，每一长度都会给出一个单长度最优时间序列，将每个时间序列拆解，分别得出这些时间序列的开始时间与结束时间，将各开始时间

16、与各结束时间依次组合形成多个组合时间序列，按下式计算该集合中各组合范围时间的值。（）（）（）式中：为由长度时间序列的开始时间与长度时间序列的结束时间及它们之间相差的所有时间序列组合而成的时间序列与正确时间序列的重叠度；为由长度时间序列的开始时间与长度时间序列的结束时间组合而成的时间序列；为正确的时间序列。在模型训练中通过多次训练后，按照下式计算每个组合时间序列多次训练的平均值。（）（）式中：为次训练后由长度时间序列的开始时间与长度时间序列的结束时间及它们之间相差的所有时间序列组合而成的时间序列与正确时间序列的重叠度平均值；为训练的总次数；为训练中国安全科学学报第卷年第次数；为第次由长度时间序列的开始时间与长度时间序列的结束时间组合而成的时间序列与正确时间序列的重叠度。计算所有时间组合范围的后，按照值从大到小进行排序，在识别过程中按该顺序选取第个不存在的时间组合为本次识别得出的最优时间组合；当所有时间组合都存在或时，则认定监测数据中无所需类别数据。实例验证.试验模型设计试验模型的原型设计参考辽宁工程技术大学热动力灾害与防治教育部重点实验室试验矿井，

展开阅读全文

基于DWT与SVM的风门开闭阶段识别方法_邓立军.pdf