1、第 卷 第 期 年北京化工大学学报(自然科学版)(),引用格式:李清亮,林焕明,吴振宙,等 基于改进狼群算法深度置信网络()模型的旋风分离器压降预测北京化工大学学报(自然科学版),():,()(),():基于改进狼群算法深度置信网络()模型的旋风分离器压降预测李清亮 林焕明 吴振宙 邓 立 廖志文 王声明 何伟宏(国家管网集团广东省管网有限公司,广州;成都德美机电设备有限公司,成都)摘 要:针对目前旋风分离器压降计算模型在准确性和实用性上的不足,为更好地指导旋风分离器的结构设计和性能优化,采用深度学习方法对其压降进行了预测。选取了影响压降的 个几何参数,采用深度学习中的深度置信网络(,)对旋风
2、分离器压降数据进行预测,并利用改进的狼群算法(,)对 模型的初始化权重和偏置参数进行寻优,构建 组合模型,同时与几种传统计算模型和机器学习模型的预测结果进行对比。结果表明,模型在计算精度上优于 模型、模型等传统计算模型,并优于反向传播神经网络(,)、支持向量机(,)、极限学习机(,)等机器学习模型,计算效率大幅提升,且具有较好的泛化性和鲁棒性,可用于旋风分离器压降参数的预测。关键词:狼群算法();深度置信网络();旋风分离器;压降;模型中图分类号:.:收稿日期:基金项目:国家管网集团科技项目()第一作者:男,年生,硕士生:引 言天然气在输送过程中,气体中常夹带粉尘、颗粒、腐蚀产物、轻烃、游离水
3、等物质,这些杂质会对燃气轮机、压缩机组、管道仪表等设备的运行产生影响,因此有必要采用过滤和分离设备对天然气中的固液杂质进行处理。目前,输气站场上多采用切向入口式多管旋风分离器,其压降和分离效率是评价旋风分离器性能的主要参数,也是确定后续压缩机组设计的重要依据。旋风分离器的压降模型主要分为半经验模型、统计模型和计算流体力学()模型 类。半经验模型以 模型、模型、模型等为主,这些模型均在旋风分离器内部流场和能量耗散的基础上建立平衡方程,为了计算方便,使用了不同程度的假设和简化处理,部分数据在计算精度上与实验值差距较大;统计模型是通过大量的实验数据对压降进行多元回归,以 模型、模型等为主,但该方法很
4、难找到合适的拟合函数来回归实验数据,在预测过程中易出现过拟合或欠拟合;模型使用 建模对旋风分离器内部的压降进行预测,计算结果可靠度较高,但步骤复杂、不易掌握。随着人工智能的发展,部分学者开始利用机器学习的方式预测压降。通过训练不同的神经网络模型来预测旋风分离器压降与几何参数之间的非线性关系,但未针对模型参数进行选 取;等采用最小二乘支持向量机对旋风分离器压降进行预测,但该模型在测试集上的泛化性能较差;王兆熙等采用粒子群算法(,)优化极限学习机(,)对压降进行了预测,但 本质上属于浅层神经网络,在解决弱条件约束的问题上性能难以进一步增强。深度学习算法中的深度置信网络(,)是机器学习的前沿技术,具
5、有强大的特征自提取能力,在处理高维、非线性数据上具有较强的优势,且预测精度和泛化能力也优于传统浅层机器学习,在管道风险评价、滴流床持液量预测、原油闪点预测等方面均有应用。但在预训练阶段,模型各节点连接权重和偏置通过随机初始化产生,会使模型在训练过程中陷入局部最优解,并增加训练时间,因此需预先优化各节点的初始化参数。狼群算法(,)由 等在 年提出,属于一种较新的仿生学算法,具有收敛性能强、可调参数少、容易实现等优点。文献在 个已知的测试函数上对算法进行了基准测试,并与 算法、万 有 引 力 算 法(,)、差分进化算法(,)、进化规划算法(,)等进行对比,验证了 算法在搜索最优解上的优势。但 算法
6、仍存在种群多样性差、后期收敛慢的缺陷,这与其初始化种群方式和搜索机制有关。基于此,本文采用 模型对旋风分离器压降数据进行预测,利用改进的狼群算法(,)选取 模型的最优初始化权重和偏置参数,形成 组合模型,并与其余常见模型的预测结果进行对比,为旋风分离器结构设计和优化提供实际参考。模型.模型 模型包括生成模型和判别模型:前者由多个受限的玻尔兹曼单元(,)组成,一个 由 个可视层和隐含层组成,层与层之间采用全连接,每个神经元节点满足随机二值分布,即只有 和 两种状态,由多个 通过无监督学习完成逐层预训练过程;后者由有监督学习功能的反向传播神经网络(,)完成误差反向微调,实现数据的回归或分类。个 结
7、构的 模型如图 所示。是基于能量生成的随机概率模型,可通过图 模型网络结构 图模型描述变量间的相互作用关系。设可视层各神经元节点状态为 ,隐含层各神经元节点状态为 ,则 的能量函数为(,)()式中,为可视层与隐含层之间的连接权重,、分别为可视层和隐含层的节点偏置。对能量函数进行正则化处理,则可视层和隐含层的联合概率分布为(,)()(,)()(),(,)()由于 模型层内无连接,当可视层状态确定时,隐含层各节点的激活概率条件独立;反之亦然。训练 是利用对比散度()的方式迭代求解参数 ,从底层 开始,自下而上逐层训练,前一个 的输出作为后一个 的输入。预训练完成后,各层 得到最优的初始化参数,随后
8、采用有标签的样本进行训练,利用反向传播自上而下对各层参数微调,从而确定最终模型。.改进的狼群算法狼作为群居动物,狼群内部执行严格的等级制度,设自上而下分为、和 狼,其中 狼的位置为最优解,余下依次为、和 狼的位置。该北京化工大学学报(自然科学版)年算法分为搜索和围捕猎物两个阶段,数学模型为()()()()()式中,为当前迭代次数;为最大迭代次数;()为当前狼的位置向量;为猎物的位置向量;、均为协同系数向量;为收敛因子,遵循线性过程从 变化到;、为,的随机数。根据不同等级狼的位置来更新个体位置,当 时,狼群分散在各个区域进行搜索;当 时,狼群集中在某个区域进行搜索。标准 算法采用随机初始化方式确
9、定种群初始位置,这种方式可能会使狼群搜索的范围过大,搜索时间过长,因此引入对立搜索计策,即当对立个体适应度值优于原个体适应度值时,则选用对立个体,反之采用原个体,具体公式为 ()式中,为对立个体的位置向量;、分别为原个体 的上下限阈值。此外,根据式()可知,收敛因子 决定了搜索的空间和范围。在迭代过程中,若前期搜索范围大,应降低 的递减速度,而后期为改进局部寻优过程,应加大 的递减速度,故引入余弦函数对 进行更新,最终形成改进的 算法。(),(),()式中,为收敛因子的极大值;为递减系数。为验证 算法的性能,采用 标准测试函数(表)进行测试,其中 为单峰函数,用于测试算法的收敛速度;为非连续性
10、阶梯函数,用于测试算法的有效性;、均为多峰函数,用于测试算法是否有跳出局部最优值的能力。分别选择人工蜂群算法(,)、算法和标准 算法作为对比算法,结果见表。表 基本测试函数 函数函数名搜索范围理论最优值维数(),(),(),().,.表 不同算法结果对比 算法均值标准差稳态迭代次数().().().().().().().().().().().().().().().().从表 可以看出,无论是从收敛速度、计算精度还是算法稳定性上衡量,算法的迭代过程、均值和标准差均明显优于其余 种算法,说明 算法具有更好的收敛性能和寻优精度。.模型预测流程本文模型采用 软件编程实现,模型的旋风分离器压降预测
11、流程见图,具体说明如下。)确定影响旋风分离器压降的主要因素,收集相关数据,建立样本集,对数据进行归一化处理,并划分训练集和验证集。)确定 网络结构,确定隐含层层数及各层节点数,由此确定狼群算法维度。)初始化 算 法 参 数,以 均 方 根 误 差第 期 李清亮等:基于改进狼群算法深度置信网络()模型的旋风分离器压降预测()为适应度函数,计算对立个体适应度值与原个体适应度值,更新个体位置。)采用式()更新收敛因子,计算新个体位置,当迭代次数达到最大限值时,算法终止,获得 的最优连接权值和偏置,对 进行预训练和反向微调。)代入训练集和验证集对模型进行评估,得到预测结果。为综合评估 模型的预测效果,
12、采用 个统计学指标平均绝对误差()、决定系数 来评价模型的优劣性。()()()()()式中,为样本数量;为第 个样本的实际值;为第 个样本的预测值。指标抵消了正负偏差,较平均误差能更好地反映模型的预测情况;指标反映了预测值与实际值的相似程度。越小,越大,模型越优。图 模型预测流程 实例分析.实验数据旋风分离器的压降特性与其几何参数和运行条件有关。一般用无量纲的欧拉数 来表示压降。研究表明,在高雷诺数的流动条件下,与几何参数的关联性较大,而与运行条件的关联性较小,。这是由于入口流量越大,压降越大,但入口速度也会随之增大,故 基本保持不变。因此,对于不同工况条件下运行的旋风分离器,只需考虑几何参数
13、对压降的影响即可。旋风分离器的几何结构如图 所示。从入口截面尺寸、排气管尺寸、旋风分离器高度、排尘口直径等 个方面考虑几何参数对压降的影响。随着入口高度 和宽度 的增大,分离器内部的最大切向速度减小,压降减小;随着排气管直径的增大,最大切向速度减小,压降减小;随着排气管插入深度 的增大,壁面摩擦引起压降增大,但增大幅度较小;随着旋风分离器总高度 和圆柱段高度 的增大,分离器内漩涡强度减小,压降减小;随着排尘口直径 的增大,排气管中的耗散动能降低,因摩擦损失引起的压降降低。综上所述,选取、等 个参数作为 压降预测模型的输入变量,为统一变量参数,将各输入变量分别除以旋风分离器圆柱段直径,选取 为输
14、出变量。提取公开文献,中的 组实验数据进行验算,数据集分布情况见表。采用五折交叉验证,随机抽取其中的 组为训练集,组为验证集。北京化工大学学报(自然科学版)年图 旋风分离器几何结构示意图 表 数据集分布情况 参数均值标准差最小值中位数最大值.网络结构的确定当样本集数量较大时,较多的隐含层层数可发挥 模型的优势,但本文训练集数量有限,隐含层层数过多会使误差无法有效地反向传播,网络参数不能及时更新,模型效率下降。根据经验,确定 模型中可视层节点数为输入变量的维数,输出层节点数为输出变量的维数,以隐含层节点数 为固定参数,确定所需的隐含层层数。不同隐含层层数对应的预测误差见图,由图可知,当隐含层层数
15、为 时,压降预测结果的 最小。隐含层节点数是构建 模型的基础,目前通常采用经验公式 (其中、分别为可视层和输出层节点数,取值范围为,)来确定最小节点数,采用样本数确定最大节点数。验证图 不同隐含层层数下的预测误差 集数量为,故最终确定隐含层节点数为,。不同隐含层节点数下的预测误差见图。当第一层隐含层节点数为 时,压降预测的 最小;随后固定第一层隐含层节点数,增加第二个隐含层继续训练,在第二层隐含层节点数为 时,压降预测的 最小。综上所述,确定 的网络结构为。图 不同隐含层节点数下的预测误差 .预测结果与对比验证采用 算法确定 模型的最优连接权值和偏置,最终生成 个连接权值,个偏置。设置 网络学
16、习率为.,动量因子为.,中设置狼群数量为,最大迭代次数为 。将预测结果与实验结果进行对比,结果如图 所示。训练集的 为.,为.,验证集的 为.,为.,验证集的预测精度有所下降,其 虽然较训练集增加了.,但模型仍保持了较佳的拟合效果和泛化能力,说明 模型能够反映旋风分离器几何参数与压降的非线性第 期 李清亮等:基于改进狼群算法深度置信网络()模型的旋风分离器压降预测关系,可用于旋风分离器压降预测。图 模型预测结果 为了验证 模型的优越性,将其与 模型、模型这两种传统模型的计算结果进行对比,结果如图、表 所示。从图 可以看出,传统模型的预测值大多偏离斜率为 的回归线,其中 模型的计算结果大部分在回归线下方,即预测值低于实验值,而 模型的计算结果大部分高于实验值,且 值越大,偏离程度越大。此外,还存在不同几何参数下部分压降的计算结果相同的现象,这是由于传统模型只考虑了、等 个参数对压降的影响,而忽略了其余几何参数的影响,导致其离群点远多于 模型。从表 可以看出,模型的 为.,为.,其 较 模型、模型分别降低了.、.,则分别提高了.和.,预测精度大幅提高。图 与传统模型的预测结果对比 在 中固