1、第 卷 第 期 年 月北 京 信 息 科 技 大 学 学 报 .文 章 编 号:():/./.多输入优化神经网络河流流量估计算法许荆张文鑫杨鸿波李健于然(北京信息科技大学 自动化学院北京)摘 要:针对传统模型在河流流量估计方面精度低、自适应能力差、易陷入局部最小值的问题提出一种改进麻雀搜索算法()优化反向传播()神经网络的算法利用雷达采集的河流水位、断面积、流速对河流流量进行估计针对麻雀搜索算法()易陷入局部极值问题进行改进通过莱维飞行对 初始个体优化从而提高种群多样性引入捕获繁衍机制至麻雀发现者中以便麻雀个体能够最大程度搜索且提高其跳出局部最优的能力使用基于适应度的差分变异算法对麻雀加入者进
2、行优胜劣汰的选择以提高流量估计的准确性和稳定性 使用云南河边水文站 年 月和 月两个月的数据搭建了、和 神经网络进行对比 实验结果表明 较 和 平均绝对误差()分别降低了.和.证实了该算法在多特征值河流流量估计方面具有较好的可行性和性能关 键 词:神经网络麻雀搜索算法莱维飞行差分变异捕获繁衍机制河流流量估计中图分类号:.文献标志码:():()().().().:收稿日期:作者简介:第一作者:许荆男硕士研究生通信作者:张文鑫男博士讲师 北京信息科技大学学报第 卷 引言河流流量关系到防洪防涝和气象预测是水文监测中的重要参数 当前河流流量估计方法主要有水文站观测法、经验法等这类方法受地理环境影响在维
3、护方面较困难且误差较大或通过遥感所得数据建立河流流量模型如:水位流量模型、断面流量模型、河流宽度反演模型等虽然可以弥补观测站的不足但由于遥感技术分辨率较低因此在河流流量监测方面使用较少 文献使用曼宁方程和贝叶斯水量平衡径流反演法()通过概率方式估计河流流量文献将传统单站水利几何法扩展为多站舍弃了先验信息仅通过河流宽度变化来估计河流流量估计结果的相对均方根误差()为 文献采用/卫星数据和 方法为./数据虽然分辨率非常高但由于水体不同存在着椒盐噪声文献使用神经网络确定出河流流量的上下限但传统神经网络仍然存在陷入局部最小值的问题 水文监测主要困难在于输入数据和模型本身因此基于智能优化算法的神经网络河
4、流流量估计模型已成为当今研究热点神经网络在求解问题时容易陷入局部最小值受初始值影响较大且由于内部过多迭代易造成计算缓慢、效率差等问题 对上述问题智能优化算法的简单灵活、适应性强等特点在神经网络中发挥着巨大的作用 本文使用麻雀搜索算法()对神经网络优化但传统麻雀搜索算法仍然存在上述问题对此文献使用 聚类改进 算法对最优个体位置引入自适应局部优化提升了算法收敛速度和精度文献对 加入者引入鸡群算法的随机跟随策略提升了算法勘探能力文献在麻雀初始阶段引入反向学习方法改变初始种群生成规律文献将 和鸟群算法中的飞行思想结合扩大了种群搜索范围避免陷入局部最小值文献在 发现者中引入学习系数避免种群同化而快速收敛
5、 上述文献对麻雀搜索算法作出了不同程度的改进虽能够跳出局部最小值但全局搜索能力和迭代初中后期的扰动平衡性不强陷入局部最小值问题仍然存在针对现有算法的不足结合河流复杂度高、环境差等特性提出一种估计精度更高、适用范围更广的改进麻雀搜索算法优化()的反向传播()神经网络 以更好地用于河流流量估计为验证本文所提算法采集了云南河边水文站雷达 年 月和 月两个月的水位、断面积和流速数据在对其进行异常值的处理后分别搭建了、和 河流流量估计模型进行实验比较 流量估计模型 算法流程如图 所示图 算法流程.神经网络模型在水利领域中由于数据集不同 神经网络三特征值输入相较于单特征值(水位)输入并无优劣之分两者各有千
6、秋但目前该领域多采用单特征值输入 神经网络模型强大之处在于其处理非线性的能力较强若仅采用单输入后续实验、研究等无法 在 神 经 网 络 上 开 展 例 如 卷 积 神 经 网 络()的卷积、池化等操作也可用于回归问题中则需要多特征值的输入因此本文提出采用多特征值输入方法应用于河流流量估计旨在提供一种可靠实用的思路和方法三输入 神经网络结构如图 所示 模型共包含三层通过信号正向传播和误差反向传播调节第 期许荆等:多输入优化神经网络河流流量估计算法 权重和偏置最终得到在误差允许范围内的河流流量估计结果是当前被广泛应用的一种机器学习算法图 神经网络结构.改进麻雀搜索算法传统优化算法如拟牛顿法、梯度下
7、降法等要求函数连续并可微但实际中并不能满足且河流流量具有随机性、复杂性 本文结合该河流特性提出了一种 神经网络模型用于估计河流流量 它能够不受目标函数可微、可导的限制独立于求解域适用于复杂场合又能够解决 易陷入局部最小值的问题 是模拟自然界麻雀觅食的一种智能优化算法经过不断迭代能够得到具有最小适应度(流量估计结果与实际值的误差)的麻雀个体其对应的觅食位置为最优位置即河流流量模型的最优解在处理某项问题中我们需通过不同的算法优化 来逼近最优解 因此本文引入了多种算法来改进 寻找最优解以提高河流流量估计模型的精度由于 初始个体由无规律的随机数产生容易出现群体高密度聚集集中于某些值附近降低迭代初期种群
8、的多样性使得 优化的神经网络河流流量估计模型无法最大程度跳出局部最优解 因此本文引入了莱维飞行思想让其在迭代初期就能获得较低的适应度即较低的估计误差 同时在迭代中为了提高 的全局搜索能力利用繁衍捕获机制和差分变异算法对麻雀发现者和加入者进行改进.莱维飞行思想麻雀搜索觅食其飞行规律可以认为是随机游走过程而莱维飞行正是对这种游走过程的模拟 在麻雀初始种群中引入莱维飞行思想可以使得种群初始位置更广泛降低其盲目性平衡算法寻优精度与速度快速建立起准确的流量估计模型基于莱维飞行的麻雀个体位置更新表达式为 ()()式中:为当前迭代次数为第 时刻种群中第 只麻雀在 维所处位置 为步长()服从莱维分布路径满足(
9、)式()等价于:()式中:为服从()分布的随机数 为服从()分布的随机数通常 .差分变异算法差分变异算法是基于种群进化的算法 在麻雀加入者中通过交叉选择两个父代作差生成子代并用贪婪选择思想选择下一代种群 基于差分变异算法的麻雀个体位置更新表达式为 ()()式中:和 分别为种群中不同随机个体的位置 为缩放因子 针对河流流量特性本文将其进行了改进 因为当前时刻河流流量变化总与上一时刻有关所以 时刻麻雀位置也总与 时刻麻雀位置相关同时由于麻雀位置的优劣最终由麻雀适应度所体现所以在公式中可表现为与适应度相关 改进后的 表达式为 (/)()式中:为第 次迭代麻雀个体适应度 为最大迭代次数由式()可知在迭
10、代初期适应度差的麻雀其值较大变异增量大可增加其局部扰动提升勘探能力适应度较好的麻雀 值较小变异增量较小在迭代后期适应度较差的麻雀 值也较大同样能够增加局部扰动 但对于迭代初期而言由于 变大则式(/)的值下降变异增量有所下降以防止迭代后期麻雀漫无目的地移动以提高迭代速度.捕获繁衍机制在麻雀搜索算法中发现者是整个种群中最重要的职位它直接影响到麻雀种群整体觅食效果即影响河流流量估计模型最终结果本文将捕获机制引入麻雀发现者中 当发现者在搜寻食物的过程中并不是所有麻雀都能意识到天敌的存在飞往安全区域而有一部分麻雀将会被 北京信息科技大学学报第 卷天敌所捕获同时将被捕获麻雀的位置信息记录至矩阵变量 中 当
11、该矩阵记录的麻雀位置信息达到一定上限 时则基于麻雀适应度筛选出最优的 个位置信息去替换麻雀种群中随机选取的 个麻雀位置同时变量 清空以便记录下次迭代被捕获麻雀的位置信息 矩阵中所存储的麻雀位置信息为()()且 ()式中:为 矩阵中行索引、为()的随机数 为的随机数为预警值为第 次迭代中第 只麻雀全部维位置为不同于麻雀 的全部维位置 为设定的捕获概率范围为()该值越高麻雀被捕获概率越高麻雀位置更新也越快捕获机制产生的位置信息是当前被捕获麻雀与种群中其他麻雀个体间交流而获得该方法对觅食空间搜索更加充分且不会破坏算法平衡当发现者被捕获后发现者种群中将缺少成员因此本文提出繁衍机制来补充缺失的麻雀 对于
12、发现者中第一只被捕获麻雀而言将加入者麻雀基于适应度进行排序选取排名最优的第一只麻雀和被捕获麻雀所遗留信息进行基于非线性正余弦算法繁衍从而补充发现者种群中被捕获的麻雀因此在原有的基础上提高了麻雀种群的多样性扩大了发现者可搜索范围 后续被捕获麻雀同理 基于非线性正余弦繁衍机制的麻雀位置更新表达式为 .()式中:为第 次迭代麻雀在 维的最优位置、分别为、内的随机数 是基于迭代次数 而变化的系数意味着在不同迭代时刻麻雀搜索范围都各不相同 的表达式为.()()利用非线性正余弦算法进行麻雀繁衍可以降低种群随机生成的盲目性有利于种群间相互交流提高流量模型和数据间的匹配程度.算法步骤 在 基础之上引入了莱维飞
13、行思想、差分变异算法、捕获繁衍机制避免了算法陷入局部极值的风险提高了流量估计模型的可靠性和准确性具体算法步骤如下:步骤:初始化参数包括种群数量 、最大迭代次数 、问题求解维度 、发现者数量、警戒者数量 步骤:根据式()生成麻雀初始种群并通过目标函数计算初始适应度并排序步骤:更新麻雀发现者位置并计算适应度根据式()若 且 则该麻雀会被捕获存储于 矩阵中此时发现者中被捕获麻雀位置由繁衍算法进行生成步骤:更新麻雀加入者、警戒者位置 加入者位置通过差分变异算法生成同时与传统 加入者位置更新公式所更新的麻雀位置进行比较选择适应度更优的麻雀个体进行保存步骤:判断是否满足迭代次数 若满足则结束循环并记录全局
14、最优解否则返回步骤 实验.异常数据处理本文所用数据其水位、流速波动较小变化有规律因此使用简单的众数法修正异常和缺失数据即可 将数据按每 划分为一组进行实验.数据样本选择为验证本文所提算法的可靠性从云南曲靖河边水文站 年 月和 月两个月的多组数据中随机选取 组连续数据进行实验 训练集和测试集按 划分 数据集的输入特征为水位、断面积和流速输出为河流流量.性能评价指标采用平均绝对误差()、均方根误差()、平均绝对百分比误差()和均方误差()种性能指标对河流流量估计模型进行评价误差越低表示模型拟合度高 平均绝对误差为 ()均方根误差为()()平均绝对百分比误差为 ()均方误差为第 期许荆等:多输入优化
15、神经网络河流流量估计算法 ()()式中:为样本真实值 为样本估计值 为样本数量.设定 参数经过多次实验最终将麻雀种群数量设置为迭代次数为 预警值为.发现者数量占种群的 通过“试错法”最终确定神经网络为 层输入层节点为 两层隐含层节点各为 输出层节点为 最大迭代次数 学习率为.实验结果本次实验使用、和 神经网络分别对河流流量进行估计 麻雀搜索算法收敛曲线如图 所示河流流量估计结果如图 所示均方误差如图 所示图 和 收敛曲线从图 可知当迭代次数 时 适应度小于 适应度表明莱维飞行混沌映射生成的初始麻雀种群能够在迭代开始时找到较合适的麻雀种群当 时属于迭代后期差分变异、捕获繁衍机制等扰动已趋近于最小
16、值最优解已被找出目标函数正在收敛 只需 次迭代就可收敛因此效率远比 高从图 可知、模型都能拟合出流量真实值的变化规律但 神经网络拟合的流量估计曲线趋势明显优于 和 神经网络拟合的曲线更接近流量真实值拟合效果最优从图 可知 误差明显低于 和 神经网络 这是由于 神经网络初始权重和图 、估计值和真实值图 、误差值偏置由系统随机数产生而 和 初始权重和偏置则采用 经过不断迭代最终收敛而得 由系统随机数产生初始权重和偏置的 神经网络其结果误差相对较大而通过智能优化算法优化的 神经网络误差则较小因此神经网络初始权重和偏置在整个预测过程中是非常重要的、和 的 性 能 指 标 如 表 所示表 、与 性能指标对比算法/.由表 可知 相较于 河流估计模型其 降低了约.降低了约.降低了约.相较于 其 降低了约.降低了约.降低了约.由此可见改进麻雀搜索算法优化的 神经网络在水利模型上有更高的精 北京信息科技大学学报第 卷度拟合度更好可靠性也较高为验证 各参数对优化效果的影响选取不同种群数 和不同迭代次数 进行多次实验结果如表 所示表 不同参数对优化效果的影响/.由表 可知当 种群数 和迭代次数 增大时误差总