1、2023 年第 3 期工程勘察Geotechnical Investigation&Surveying63 基于 ALSTM 模型的基坑周边建筑物沉降预测余 凯,吴来根(福建岩土工程勘察研究院有限公司,福州 350108)摘要:中短期基坑沉降监测序列具有非线性和数据量小的特点,导致常规预测模型很难获取准确的预测结果。针对传统模型未考虑到历史时刻沉降情况对未来沉降量具有不同影响的缺点,本文采用 ALSTM(Attention LSTM)预测模型,并以某大厦基坑工程变形监测的数据为例进行验证。实验结果表明,相比 LSTM、支持向量回归和 BP 神经网络模型,ALSTM 模型能够取得更加准确的预测结
2、果,适用于短期和中短期两种情况下的沉降变形预测。关键词:基坑监测;沉降预测;LSTM;注意力机制中图分类号:TU196文献标识码:APrediction of buildings settlement around foundation pit based on ALSTM modelYu Kai,Wu Laigen(Fujian Geotechnical Engineering Investigation and Research Institute Co.Ltd,Fuzhou 350108,China)Abstract:The monitoring sequence of medium a
3、nd short-term foundation pit settlement has the characteristics of non-linearity and small amount of data,which makes it difficult for conventional prediction models to obtain accurate prediction results.Aiming at the disadvantage that the traditional model does not take into account the fact that t
4、he settlement at the historical moment has different effects on the future settlement,this paper adopts the ALSTM(Attention LSTM)prediction model,and takes the deformation monitoring data of a building foundation pit as an example to verify;the experimental results show that,compared with LSTM,suppo
5、rt vector regression and BP neural network models,the ALSTM model can achieve more accurate prediction results,and is suitable for the prediction of settlement deformation in both short-term and medium-short-term conditions.Key words:foundation pit monitoring;settlement prediction;LSTM;attention mec
6、hanism收稿日期:2022-01-12;修订日期:2022-02-24作者简介:余凯(1974-),男(汉族),江西南昌人,大学本科,高级工程师.0引言随着社会经济的蓬勃发展,我国城市化进程不断加快,越来越多的深基坑工程也随之出现1。深基坑工程(如地下商场、地下停车场、地铁等)大多位于城市经济繁荣的区域,其安全问题除了基坑自身的形变安全外,还包括基坑开挖过程中对周边建筑物和居民生命财产安全的影响,因此,对基坑及周边建筑物进行沉降监测并对监测数据进行分析处理和预测,对于深基坑工程的安全施工尤为重要2,3。常用的变形预测方法主要有回归分析法、时间序列分析预测法、灰色系统预测法和人工神经网络预测
7、法等,各种模型有着各自的优势和局限性。王建民等在矿山边坡监测中运用了高斯回归预测模型4;李瑞等在大坝变形监测中采用多元线性回归法5,回归分析法较为成熟且容易实现,但对数据的准确性要求较高,个别粗差的存在会影响其预测结果;针对沉降数据非平稳的特征,曹净、徐爱功等将时间序列分析应用于地铁沉降和建筑物基坑沉降预 测 中,得 到 了 真 实 反 映 变 形 情 况 的 预 测 结果6,7。灰色模型8 10通过小样本数据对变形系统的规律进行预测,但对非线性、非平稳序列的沉降数据预测效果较差。近年来,人工神经网络由于其强大的自学习能力,在处理非线性以及复杂时序问题中具有独特的优势,发展较为迅猛;王磊等将时
8、间序列与 BP 神经网络相结合应用于沉降监测11;张文博等在建筑物基坑预测中采用 BP 神经网络方法,证明了 BP 神经网络模型具有较高的精确性和64 工程勘察Geotechnical Investigation&Surveying2023 年第 3 期稳定性,但 BP 神经网络也存在训练收敛速度较慢等问 题12;许 宁 等 利 用 长 短 时 记 忆(Long Short-Term Memory,LSTM)神经网络模型进行基坑沉降预测13,分别进行单点预测和多点预测对比实验,得到了较好的预测精度。在实际工程中,不同时刻的沉降情况对未来沉降量影响是不同的,针对传统模型未考虑到历史时刻沉降情况对
9、未来沉降量具有不同影响的缺点,本文采用 ALSTM(Attention LSTM)预测模型进行实例研究,该模型的特点是将历史不同时刻的重要程度纳入到长短时记忆(LSTM)神经网络模型中14。为验证 ALSTM 模型可用于不同样本数量条件下的沉降变形预测,分别采用短期和中短期两种样本划分方式进行训练和测试。1研究方法1.1长短时记忆网络长短时记忆网络是一种循环神经网络,由于其独特的门结构设计使该网络具有记忆信息的能力,常被用 于 时 间 序 列 预 测 和 自 然 语 言 处 理 等 任 务中15 17。假设输入 LSTM 的时间序列为 X=x1,x2,xn,则对应的 LSTM 包含 n 个细胞
10、;其中第 t 个细胞的输入为时间序列 xt、上一个细胞的输出 ht-1和状态 ct-1,输出为当前细胞的输出 ht和状态 ct。LSTM 网络中每个细胞的工作流程相同且共享参数,首先通过遗忘门决定是否从上一个细胞输出的状态 ct-1中丢弃无效信息,并由输入门决定在ct-1中加入多少新的有效信息,在 ct-1中删除无效信息和添加有效信息后得到当前细胞的状态 ct,上述过程的计算表达式为:ft=(Wfht-1,xt+bf)(1)it=(Wiht-1,xt+bi)(2)ct=tanh(Wcht-1,xt+bc)(3)ct=ftct-1+itct(4)式中,ft和 it分别为遗忘门和输出门的输出;表示
11、 Sigmoid 激活函数;tanh 表示 tanh 激活函数;W为神经元的权值矩阵;b 为偏置。在得到当前细胞的状态 ct后,通过输出门可以计算细胞的输出 ht,计算过程为:ot=(Woht-1,xt+bo)(5)ht=ottanh(ct)(6)1.2ALSTM 预测模型对于沉降量序列 X=x1,x2,xn,在对n+1 时刻的沉降量进行预测时,通常以 n+1 时刻之前的若干个时刻的沉降量作为 LSTM 模型的输入。考虑到实际工程中不同时刻的沉降情况对未来沉降量的影响不同,本文通过采用注意力机制将不同时刻的重要程度纳入到 LSTM 模型中,以获取更加准确的预测结果。假设预测模型的输入为 S=x
12、1,x2,xt,首先经过一层神经网络得到特征向量 V=v1,v2,vt,再利用 Softmax 函数输出所有时刻特征的权重向量,最后将输入 S 与权重 做哈达玛积,得到重标定后的特征向量 R=r1,r2,rt,计算过程为:V=WS+b(7)=Softmax(VT)(8)R=ST(9)式中,W 为神经网络的权重矩阵;b 为偏置矩阵;Softmax 表示 softmax 函数,其表达式为:Softmax(vi)=evitj=1vj(10)在 完 成 权 重 的 分 配 后,将 特 征 向 量 R 作 为LSTM 的输入,并通过全连接层输出预测值。由于所建立的预测模型结合了注意力机制和 LSTM,所
13、以将其称为 ALSTM(Attention LSTM)。相比标准的LSTM 模型,ALSTM 模型能够通过网络学习的方式为不同时刻的特征赋予相应的权重,更适用于时间序列预测问题。2实例分析某大厦位于福建省某市二环路南侧,五四北路东侧,南侧紧邻湖前河,分布有地下管线;东侧为省老年医院,其高压配电房与场地相隔仅 15m;建筑物沉降监测采用徕卡 NA2 精密水准仪。2.1实验数据如图 1 所示,选取基坑周边的 H2、F9 和 L7 监测点,其中 H2 为施工场地临近河岸的河道监测点,F9 为施工场地东侧配电房上的监测点,L7 为基坑北侧地表的道路监测点。监测时间为 2018 年 2 月 14 日至
14、2018 年 8 月26 日,共 49 期,监测内容为累积沉降量,监测点H2、F9 和 L7 的原始监测数据如图 2 所示。为验证模型的预测能力,分别对短期预测和中短期预测进行实验分析。原始的沉降量序列按照8 1 1 的比例划分为训练集、验证集和测试集。其中,训练集用于预测模型训练,验证集用于模型2023 年第 3 期工程勘察Geotechnical Investigation&Surveying65 图 1监测点点位分布 Fig.1Distribution of monitoring points图 2实测沉降量序列Fig.2Data series of measured subsidenc
15、e value参数选取,测试集用于预测精度评价。样本数量的具体分布如表 1 所示。表 1训练集、验证集和测试集样本数量对比Table 1Comparison of sample size on training set,verification set and test set类别总期数训练集期数验证集期数测试集期数短期302433中短期4939552.2实验流程本文实验的具体步骤为:(1)首先完成数据集的划分,对其中训练集数据进行归一化和滑动窗口采样。对于深度学习模型,通常需要对输入数据进行标准化,以加快网络的学习和收敛速度,此处采用 Z-Score 标准化,其计算方式为:X=X-X(11)
16、式中,X 为划分后的训练数据;X 和 分别为 X 的平均值和标准差;X为标准化后的序列。在对训练数据进行标准化后,需要通过滑动窗口采样生成适用于神经网络训练的样本。对于 X=x1,x2,xi,假设滑动窗口的大小为 t(t1),那么第 1 个训练样本为input:x1,xt);output:xt+1,第2 个 训 练 样 本 为 input:(x2,xt+1);output:xt+2,依 此 类 推,最 后 一 个 训 练 样 本 为 input:(xi-t,xi-1);output:xi;经过上述滑动窗口采样后便得到 i-t 个训练样本,其中滑动窗口 t 对应 LSTM 中的 time-steps 参数,决定网络所接受的信息量和细胞的数量;(2)模 型 训 练 和 参 数 调 优。将 训 练 集 输 入ALSTM 模型进行训练,通过网格搜索选择在验证集上精度最高时所对应的 time-steps 和 LSTM 细胞的神经元数量 units 作为最优参数;(3)滚动预测和反归一化。在完成 ALSTM 模型的训练后,将xi-2,xi-1,xi 作为输入并预测出xi+1,然后将 xi-1,xi