1、第 卷 第 期 年 月北京工业大学学报 基于庞大算例变量提取的办公建筑能耗预测方法及应用姬 颖,连会会,陈永保,谢静超,刘加平(北京工业大学城建学部,北京;北京工业大学绿色建筑环境与节能技术北京市重点实验室,北京;上海理工大学能源与动力工程学院,上海)摘 要:模拟法应用专业软件,可准确计算动态能耗,但输入参数烦琐且建筑几何模型确定后往往无法更改;数据挖掘法计算速度快,适用条件多样,但是需要长时间历史数据进行训练,效果受样本数据限制 针对以上问题,提出一种基于庞大算例变量提取的办公建筑能耗预测模型,利用 建立批量典型建筑模型,调整建筑参数生成百万条数据作为训练数据集;采用 算法,筛选影响负荷的特
2、征因素,构建负荷预测模型;结合 中空调设备能耗计算模型,应用 编译实现能耗预测,并在北京某办公建筑中进行应用和验证 结果表明,筛选的 维特征变量,可保证模型预测准确度在 以上,逐日能耗的预测平均相对误差为.应用标准年气象参数计算全年建筑能耗,逐月平均相对误差为.,建筑实际能耗指标为.(),预测能耗指标为.(),相对误差为.关键词:办公建筑;能耗预测;模拟数据库;特征变量;中图分类号:;文献标志码:文章编号:():收稿日期:;修回日期:基金项目:国家自然科学基金青年基金资助项目();“十三五”国家重点研发计划资助项目()作者简介:姬 颖(),女,讲师,主要从事建筑大数据在建筑节能方面的研究,:,
3、(,;,;,):,第 期姬 颖,等:基于庞大算例变量提取的办公建筑能耗预测方法及应用 ,.,.(),.(),.:;我国承诺到 年前停止增加二氧化碳排放,争取 年前实现碳中和 我国公共建筑能耗及碳排放量呈增长趋势,截至 年,公共建筑运行碳排放量为.亿(以 计),占建筑运行总碳排放量的,碳排放强度高达 设计优化、运行优化和节能改造都是公共建筑节能减排的主要途径 合理的能耗预测是上述工作的重要环节,对公共建筑供需匹配和建筑能源系统智能控制有重要意义建筑能耗预测方法可分为能耗指标法、能耗模拟法和数据挖掘法 能耗指标法是一种静态的能耗估算方法;模拟法应用专业软件,可计算动态能耗,结果准确,针对性强,但输
4、入参数烦琐且建筑几何模型确定后往往无法更改;数据挖掘法又包括回归分析法、时间序列法、人工智能法 相比之下,人工智能法具有计算速度快、适用条件多样等优点,但是大多数算法需要用到长时间历史数据进行训练,受到数据样本的限制 等于 年比较了传统机器学习方法和神经网络模型对冰蓄冷系统未来 逐时负荷的预测精度,表明人工神经网络模型的相对误差最低 朱俊丞等综述了传统机器学习算法、人工神经网络算法和深度学习算法在电力系统负荷预测领域应用,指出深度学习算法效果更优 高英博基于支持向量机算法、长短期记忆神经网络算法和()算法建立能耗预测模型,并在 栋公建内进行试验,指出模型均有良好的预测效果 等用 个数据驱动模型
5、(个浅层学习、个深度学习和 个启发式方法)预测建筑负荷,对比表明 算法和长短期记忆神经网络算法的负荷预测效果最好;针对长期预测,模型预测效果更好一些 综上可知,对于建筑能耗长期预测,算法效果更好,但该算法仍存在一定的局限性,如模型训练过程中,因训练数据量和特征维度过大或过小会导致模型的过拟合或欠拟合现象目前,把建筑历史能耗数据作为训练集来建立预测模型已经可以取得很好的精度 然而,在建筑历史能耗数据未知的情况下,仅依靠建筑自身特征、运行状况和气象参数来建立的模型的精度并不理想 同济大学许鹏团队等发起的“能耗侦探”建筑能耗预测竞赛,个参赛队伍,在不知建筑历史能耗数据的情况下,最优队伍的模型预测准确
6、性在左右 等采集了 座实际建筑的 条样本建立模型,验证结果误差为 等选用 座实际建筑,采集了 条样本建立模型,验证结果误差为.在上述分析基础上,本研究提出构建一种基于庞大算例变量提取的办公建筑能耗预测模型 试图摆脱模拟软件物理建模和长时间历史数据获取需求的限制,并且保证良好的预测精度 下面对该模型的研究方法、建立流程和应用效果进行详细阐述本研究模型建立和验证基于 实现,并应用于北京市某办公建筑 研究方法如图 所示,通过文献调研和现有模拟软件分析,得到建筑能耗的影响因素集,利用 中已搭建好的物理模型,采用控制变量法逐一离散化地改变影响因素取值,获得模拟样本数据,每一条样本数据包含所有影响因素的取
7、值和计算得到的冷、热负荷值和能耗值,最终得到模拟样本数据库 利用搭建的数据库,采用轻量级梯度提升机(,)算法筛选出关键负 荷 影 响 因 素 并 构 建 负 荷 预 测 模 型结 合 中空调设备能耗计算模型,实现只需要输入一些关键的建筑信息就可以预测建筑全年能耗北 京 工 业 大 学 学 报 年的目标,并用实际建筑数据对模型进行验证图 研究技术路线图 .数据库的构建通过文献调研和 需要用的设置参数汇总,得到影响建筑能耗的因素分为以下 类:建筑基本信息,主要包括体形系数、建筑面积、高度、窗墙比、围护结构热工性能等;外部气象条件,主要包括温度、湿度、风速、太阳辐射水平等;用能系统性能参数,如照明功
8、率密度、冷机、水泵效率等;室内环境控制条件,包括室内温度、湿度、新风量等;时间表,包括照明和设备时间表 本研究旨在预测办公建筑的能耗,输出变量为逐时能耗数据 该调研得到的重要因素可为构建模型数据库奠定基础为保证预测模型具有较好的精度及适用性,本研究选择业界认可、应用广泛的 软件构建模型的数据库,应用 调用 中已搭建的物理模型,采用控制变量法逐一等间距离散化地改变主要建筑参数,生成 个建筑算例,覆盖不同几何特征的建筑形态,共生成 条模拟数据样本,每一条数据形式为同一时刻下所有输入变量和输出变量的具体数值,所有模拟数据样本构成模拟数据库 该方法不仅可以保证模型的多样性,还可以保证训练数据的数量和质
9、量 实现流程如图 所示.模型.模型原理介绍()算法是被图 模拟数据库生成路径 广泛使用的一种算法,是该算法的典型框架,但当特征维度较高、数据量大时,存在效率和可扩展性的问题,主要原因是对于每一个特征的每一个分裂点,都需要遍历全部数据计算信息增益,这一过程在空间和时间上有很大的开销 针对该不足,微 软 团 队 于 年 提 出 模 型,是实现梯度提升决策树算法的新型框架之一,具有准确率高、处理数据量大等优点 该算法核心内容为()(,)()式中:()为训练样本对应的目标值;为基学习器的个数;为第 个基学习器的权重系数;为训练样本;为学习器分类的参数;(,)为参与学习训练的第 个基学习器损失函数和训练
10、数据确定之后,算法的训练过程即为求解损失函数极小值的优化问题,其目标函数为 (,()()式中:为样本个数;为样本序号;为数据的实际数值;()为第 个样本对应的目标值;(,()为第 个样本的损失函数值 为基于梯度下降算法得到的提升树模,在每一次加入新的子模型后,保证选取的损失函数不 第 期姬 颖,等:基于庞大算例变量提取的办公建筑能耗预测方法及应用断朝向信息含量次高的变量梯度减小,即(),Y)(),Y)()式中:(),Y)、(),Y)分别为第 次和第 次迭代的损失函数值;()、()分别为第 次和第 次样本对应的目标值;Y 为样本真实目标值 算法主要改进在于引入直方图算法和带深度限制的按叶子生长(
11、)策略直方图算法是将连续的浮点特征离散成 个离散值,并构造宽度为 的直方图,然后遍历训练数据,统计每个离散值在直方图中的累计统计量 在对特征选择时,只需根据直方图的离散值,遍历寻找最优的分割点,提高了模型的鲁棒性和计算速度 是一种更高效的策略,每次从当前所有叶子中,找到分裂增益最大的一个叶子,然后分裂,如此循环,使得模型在保证精度的同时具有较小的计算代价 该方法在保证与传统 相同精度的同时训练速度提高了 倍以上.数据集的划分方法图 影响冷负荷预测精度的参数重要度分布 为避免模型在数据集训练时过拟合,降低模型的泛化性能,训练时按照制冷季和供暖季对原始数据进行均分的 折交叉验证 折交叉验证是指将原
12、始数据集随机等分成 份,轮流将其中 份作为测试集,其余 份数据作为训练集,如图 所示 在每次试验中计算正确率等评价指标,最终通过 次试验后取评价指标的平均值来评估该模型的泛化能力.影响负荷的特征变量提取合理地选取变量可直接提高负荷预测的准确性和实用性 根据.节的调研,从中筛选出 个影响负荷的因素,分别为面积、层数、体形系数、个朝向的窗墙比、墙体比热容、墙角线性透过率、墙体图 折交叉验证的原理示意图 传热系数、楼板线性透过率、玻璃线性透过率、外墙太阳辐射吸收系数、屋顶传热系数、屋顶太阳辐射吸收系数、内遮阳开启程度、窗户太阳辐射得热系数、窗户传热系数、干球温度、室外湿球温度、风速、太阳散射辐射强度
13、、太阳直射辐射强度、新风量、人员密度、照明功率密度、设备功率密度、供热空调设定温度、制冷空调设定温度、运行时间表为简化模型,应用 模型对变量的重要度进行分析,进一步筛选出 个变量,用于建筑全年负荷预测 其中,供热空调设定温度和制冷空调设定温度分别影响建筑热负荷和冷负荷图 为冷负荷预测参数的重要度百分比累计图 可以看出,在冷负荷预测中,影响最大的 个因素为干球温度、新风量、制冷空调设定温度 筛选出的 个因素影响度累计达.图 为热负荷预测参数的重要度百分比累计图 可以看出,热负荷预测中,与夏季相同,干球温度、新风量仍是影响度占前 位的因素,排名第 的为人员密度 筛选出的 个因素累计影响度占到了.综
14、上,得到影响负荷预测的特征变量,参考相关规范标准,得到模型输入变量和取值范围如表 所示,参数变量的取值范围即模型数据库覆盖的参数区间,在该范围内本模型适用北 京 工 业 大 学 学 报 年图 影响热负荷预测精度的参数重要度分布 表 建筑负荷影响因素筛选结果及取值范围 输入变量取值范围面积 体形系数.新风量(次 ).层数 人员密度(人 )实际设定照明功率密度()实际设定设备功率密度()实际设定窗墙比(东).窗墙比(南).输入变量取值范围窗墙比(西).窗墙比(北).制冷空调设定温度 实际设定供热空调设定温度 实际设定墙体比热容().墙体传热系数().屋顶传热系数().输入变量取值范围窗户传热系数(
15、).时间表 实际设定窗户太阳辐射得热系数.室外干球温度 实际设定室外湿球温度 实际设定风速()实际设定太阳散射辐射强度()实际设定太阳直射辐射强度()实际设定 基于庞大训练数据库,选取上述影响建筑负荷的特征变量,应用 算法,构建负荷预测模型.能耗预测模型的建立本研究所开发的模型针对典型系统和设备形式,照明、设备和暖通空调模型均选自 照明和设备能耗根据照明功率密度和设备功率密度与相应建筑的面积的乘积计算得到暖通空调系统模型包括冷水机组 锅炉、地源热泵、空气源热泵等典型模型,空调系统能耗通过.节构建的模型预测的建筑负荷值计算得到 空调系统的能耗加照明和设备能耗即为建筑总能耗根据上述原理,应用 编译
16、,实现能耗预测模型的建立,模型测试集的逐时平均相对误差为.预测模型的评价方法本研究选取常见的能耗预测评估指标平均相对误差(,)来反映预测值与实际值之间的平均偏差,()()()()式中:和 分别为实际能耗值和预测能耗值,;是样本的数量 实例分析案例建筑为办公建筑,位于北京市顺义区,建筑面积 ,共 层,制冷和制热系统形式为地源热泵机组 ,机组为螺杆式地源热泵机组.数据获取根据表 筛选的 个关键因素,在模型预测时获取参数分以下 类:建筑客观数据、气象数据和运行时间表 建筑客观数据包括几何参数、围护结构热工参数、运行及使用数据,该数据通过实际建筑采 第 期姬 颖,等:基于庞大算例变量提取的办公建筑能耗预测方法及应用集得到;气象数据中实测的建筑气象参数是通过实验室气象站获得,全年气象数据选用标准年气象数据;运行时间表根据办公建筑的使用特征划分为工作日和周末,设定运行时间表后缀为“”的文件,计算时直接调用该文件,时间表中的具体数值根据建筑实际运行状况设定为验证模型预测的精度,获取了实测的建筑机组功率、全年月能耗账单和建筑总能耗指标,数据由大厦持有方提供.建筑客观数据建筑客观数据包括建筑几何参数、围