1、摘要院 针对循环神经网络存在的预测误差累积问题,提出了融合 Scheduled Sampling 采样机制的序列预测算法。该算法选用较大概率 p 作为选择使用真实值或是前一帧预测数据作为当前时间步输入依据,并随着时间的推移 p 值逐渐变小,使解码器更倾向于使用预测序列作为输入,以此增加模型的健壮性。实验结果表明:该算法能够将 Human3.6M数据集中绝大多数动作短期预测误差降低到 0.5 dm 左右,相比原方法降低了 0.20.4 dm,在行为预测上表现良好。关键词院 行为预测曰循环神经网络曰Scheduled Sampling中图分类号院 TP183文献标识码院 A文章编号院 2095 原
2、 0926(圆园23)02 原 园园54 原 园6Human behavior prediction based on Scheduled Sampling mechanismDU Wei袁 YU Yanan袁 YIN Guanghua渊 School of Information Technology Engineering,Tianjin University of Technology and Education,Tianjin 300222,China 冤Abstract院Aiming at the problem of prediction error accumulation in
3、 recurrent neural networks袁 a sequence predictionalgorithm is proposed based on Scheduled Sampling mechanism.A high probability p is selected as the basis for choos鄄ing to use the real value or the predicted data of the previous frame as the input of the current time step袁 and graduallydecreases the
4、 p value over time袁 making the decoder more inclined to use the predicted sequence as the input,so as toincrease the robustness of the model.The experiment results show that this method reduces the short-term predictionerror of most actions to about 0.5 dm in Human3.6M data set袁 which is 0.2-0.4 dm
5、lower than the original method袁and performs well in behavior prediction.Key words院 behavior prediction曰 recurrent neural network曰 Scheduled Sampling基于 Scheduled Sampling 采样机制的人体行为预测杜薇,于雅楠,尹光华(天津职业技术师范大学信息技术工程学院,天津300222)收稿日期院 2023-04-16基金项目院 天津市教委科研计划项目(2021KJ009).作者简介院 杜薇(1997),女,硕士研究生,研究方向为计算机视觉.通
6、信作者院 于雅楠(1984),女,副教授,博士,研究方向为计算机控制技术、计算机视觉与图像分析,援行为预测1是指对人类行为意图的进一步推断和预判,是计算机视觉和机器智能领域具有重要意义和挑战性的课题,可以帮助机器理解人类的各种行为。人体的运动预测是困难的,因为人类天生就会表现出复杂的行为,且在不同个体上或不同环境下行为差异较大。由于人体运动在前期阶段动作执行还未成型,关键信息较少,完整动作序列还处于未知状态,准确的动作预测仍然存在很多问题。在过去的几年里,让计算机通过一系列智能算法来自动理解视频序列中的人体动作序列一直都是国内外计算机视觉和计算机图形学领域中研究的重点。除了对自身行为和仿真机器
7、人2的研究和探索外,随着微软 kinect、华硕 xtion等低成本深度传感器的快速发展,采集设备可以实时生成精确的骨骼姿态数据,使得捕捉人体骨架动作变得更加简单、方便和准确。人体行为预测的实用价值高,在安防、交通、机器人、无人驾驶等领域都有广泛的应用。在安防领域,通过智能监控设备采集、识别人体骨骼关键点,分析并预测人体动作姿态,应用于被测试者的身份识别及动作识别3-4,增强公共场所的系统安防能力,智能采集匹配犯罪分子和嫌疑人骨骼、姿态信息,方便协助警方调查重大案件。在自动驾驶领域,精准的人体骨架识别以及运动轨迹预测对于提升无人车的安全性能具有重要意义5,尤其是在真实复杂场景下的行为理第 33
8、 卷第 2 期圆园23 年 6 月天 津 职 业 技 术 师范 大 学 学 报允韵哉砸晕粤蕴 韵云 栽陨粤晕允陨晕 UNIVERSITY OF TECHNOLOGY AND EDUCATIONVol.33No.2Jun.2023DOI:10.19573/j.issn2095-0926.202302010第 2 期解与预测是自动驾驶车辆进行安全高效决策、规划及控制的核心。随着人工智能技术的不断进步,机器要实现与人类的自然互动,必须在理解人体姿态行为的基础上,高精度预测未来可能会发生的行动,积极探索人类活动所遵循的有规律的模式。本文聚焦基于循环神经网络的人体 3D 骨架关键点6行为预测,针对循环神
9、经网络误差累积问题,对网络模型训练所采用的采样机制进行研究与改进,提高序列预测算法模型的预测精度及鲁棒性。1人体行为预测国内外研究现状鉴于人体动作的高度复杂性以及复杂环境对行为预测的多因素干扰,人体行为预测研究面临众多挑战。相比于传统的卡尔曼滤波算法7和隐马尔可夫链算法(HMM),基于深度学习方法的人体行为预测效果表现卓越,备受研究者关注的预测模型主要包括:循环神经网络(recurrent neural networks,RNN)、Transformer网络以及生成对抗网络等,以上模型在多序列帧预测任务中的表现效果突出7。循环神经网络被广泛运用于各种序列预测任务中,在机器翻译、语音识别、图像生
10、成、姿势识别8-10等领域表现突出。然而,许多训练循环神经网络的方法被认为训练速度慢或者模型过于复杂,容易造成误差累积和堆叠问题,许多研究者针对这一问题做了探索。针对训练循环神经网络过程中长期依赖的学习和误差累积的问题,Li 等11将注意力重点放在了噪声对前馈神经网络性能的影响,尝试将在循环神经网络中加入定量的噪声来提高网络的收敛性和泛化性。每个时间步加入的各种噪声参数在网络训练阶段找到合适的权重空间区域,以此提高局部最小值的错误累积,但噪声参数的加入会导致网络训练难度加大,加大了模型的训练时长。Prokhorov12提出 Echo state networks(ESN)对于复杂动态系统进行建
11、模,它采用固定的随机选择值作为大部分权重参与训练,仅将连接到输出链接上的权重进行动态训练。这种方法使得模型更加易于训练,但由于隐藏层的随机连接导致其性能高度不稳定。Obst 等13针对这一缺点提出了 tamed reservoirs,有效利用前馈训练的方法将所有的循环连接都经过了训练,在时间序列预测方面较前者表现更好。Li14提出了预处理随机梯度下降(stochastic gradient descent,SGD)算法,它不需要引入参数或预训练操作,通过自适应估计来加速梯度下降,使得预处理随机梯度的扰动幅度与待训练参数的扰动幅度相匹配,自然地抑制梯度噪声从而优化 SGD 方法。除此之外,Gui
12、roy 等15通过分析目标景观的各种属性来研究神经网络在基于梯度元学习中的泛化,通过基于梯度训练过程中的几个步骤的微调,使得模型的元训练解适应新任务后得到的元测试解变得更平坦,损失更低。研究通过优化模型训练参数、加入噪声来优化模型,但有限的内存资源和硬件配置往往潜在限制了模型的参数数量,参数的数量在一定程度上影响网络性能。针对循环神经网络存在误差累积的问题,本文对比了不同采样机制在 Seq2Seq 模型上的预测效果,提出基于 Scheduled Sampling16采样机制训练 RNN 行为预测模型,该方法运用分类器的输出作为 RNN 的额外输入,以学习输出序列模型间的时序联系,即 Teach
13、ingforce17。模型采用端到端的循环神经网络作为基础模型进行训练,从分割训练测试阶段改变训练期常规RNN 分类器输入,将连续采样时间内运行的循环神经网络梯度作用于时序监督学习,减少模型训练带来的累积误差。RNN 的额外输入是以一定比例将真实值与预测值相结合,在训练初期真实值输入占比较大,允许 RNN 对预测误差进行补偿,以此缩小模型预测差距;而训练后期逐步融入预测值,提高模型自身泛化能力。该方法对人体行动预测具有较高的准确度,将400 ms 内行动预测误差降低至 0.5 dm 左右。2人体行为预测模型2.1Seq2Seq网络模型序列与序列(sequence to sequence,Seq
14、2Seq)模型结构是自然语言处理中非常经典的文本生成模型,属于编码器-解码器(encoder-decoder)结构的一种。Seq2Seq 基于循环神经网络模型构建,能够适用于多种应用研究,如语言翻译、人机对话等,其模型结构如图1 所示。模型包括编码器(Encoder)和解码器(Decoder)两部分,其输入输出序列都为可变长度。Encoder 将输入序列压缩成指定长度的向量,将学习到的特征输出为图 1Sequence to sequence 模型序列输出序列输入序列输入DecoderEncoderGRUGRUGRUh2CCCCh1h0BIGRUBIGRUBIGRU杜薇袁等院 基于 Schedu
15、led Sampling 采样机制的人体行为预测55天 津 职 业 技 术 师范 大 学 学 报第 33 卷一个隐含状态 c,并将其作为初始状态输入到 Decoder中,解码器接收到上下文信息向量后对序列信息解码,并输出预测序列。在 Seq2Seq 模型中,测试时发现 Decoder 在一个时间步内会生成一个动作序列,并在下一个时间步将生成序列作为输入反馈给模型,由此生成整个动作序列。由于模型在不同的输入数据分布上进行训练的,并非来自真实序列,在预测过程中错误会随着时间的推移逐渐累积,这种差异被称为暴露偏差。由此可见,预测过程的内部算法非常脆弱,在解码器解码过程中,如果其中一个循环神经网络解码
16、出现了误差,该误差会随之传递到下一个循环神经网络单元里,如此往复,使得训练结果误差逐渐增大,网络将会变得难以收敛,对预测效果也会产生巨大影响。2.2Teaching force从 Seq2Seq 模型来看,解码器在训练期间为保证预测上下文向量联系,解码器的上一帧输出向量作为当前帧的输入向量,并进行动作序列的帧间预测。从实际预测效果来看,这种运行方式有风险,因为预测结果极易受到预测误差的影响,导致预测结果的误差值不断累积,偏离实际输出,并且很难溯源到错误源头。针对该问题,通常循环神经网络有两种运行方式:一种是 Free-running,结构如图 2 所示;另一种是 Teachingforce,结
17、构如图 3 所示。其中,Teaching force 从解码器的向量输入着手,有效地解决了这一问题。Teaching force 与普通编码器类似,创建输出的预测张量,并将所有预测值 y 保存,使用 sos 令牌作为第一个输入 y1,但不同的是在循环解码过程中,将输入令牌的 yt、先前的隐藏状态 st-1和上下文向量插入解码器,接受预测值 yt+1以及最新的隐藏状态 st,通过设置随机 Teaching force 阈值,即使用 Teaching force 的概率,当随机生成的数值大于此阈值时,使用 Teachingforce,否则不使用。Teaching force 方法的本质就是根据一个
18、固定阈值来选择当前时间步输入方式,即采用目标序列中的真实数据,还是采用前一序列帧来预测数据。这样的训练方式使得预测结果受到真实值参与的影响,减少模型训练过程中的误差累积。2.3Scheduled Sampling循环神经网络的运行方式不仅限于 Teachingforce 方法的加入,研究者在此基础上改善了 Teachingforce 采样机制,摒弃掉 Teaching force 固定阈值的呆板设置,提出了阈值在训练过程中跟随时间推移而变化的 Scheduled Sampling,通过在训练过程中随着时间的推移逐渐降低训练阶段输入的真实值频率,加速模型学习训练,在达到相同性能条件下,减少训练的
19、迭代次数,提高预测效果。本文在 Seq2Seq 模型的解码器部分引入 Schedu-led Sampling 采样机制,解决网络训练时由于序列帧预测数据产生偏差,从而导致误差累积的问题。Sched原uled Sampling 算法结构如图 4 所示。训练时不完全采用真实数据或预测数据作为当前时间步的输入,而是以概率 p 值选择目标序列中的真实数据,以概率1-p 值选择模型前一序列帧预测数据。在模型训练初期训练不够充分的条件下,p 值尽量选择较大值,使用目标序列中的真实数据来加速网络训练;而随训练时间的推移,模型训练渐入佳境,这时p 值要尽量变小,使得模型逐步实现自我预测。在借鉴前人经验的基础上
20、,p 值初值选定为 0.9,同时设定图 2Free-running图 4Scheduled samplingy赞ny赞n-1y赞1y赞1y1y赞n-1y赞nyn-1yn1-p1-p1-p1-pppppDecoder以 p 的概率靠预测以 1-p 的概率靠真实值图 3Teaching forcey赞1y赞n-1y赞ny1yn-1ynDecodery赞1y赞n-1y赞ny赞1y赞n-1y赞nDecoder56第 2 期衰减系数为 0.9,通过系数衰减下降的方式,训练迭代10 000 次进行一次衰减。该方法的本质是希望通过在训练阶段混入模型自身的预测数据作为输入,减小其与测试阶段输入数据分布的差异,
21、从而减轻预测偏差。3实验与分析3.1实验设置网络模型采用 Seq2Seq 体系结构,编码器使用双向 GRU,方便建立上下文向量联系,解码器采用单向GRU,设置隐藏层单元为 1 024 个,学习率为 0.005,批次为 16,训练迭代 100 000 次,输入序列为 50,输出序列为 10,采用 GPU 训练。实验参数的选定参考了前人经验以及具体的实验结果。本实验在解码器采样机制中设置了相关控制参数,在使用 Teaching force 或Scheduled Sampling 采样机制进行训练时,更改相应参数值为 True。其中 use_ teacher_force 和 use_schedu-l
22、ed_sampling 参数,只能其中一者设置为 True。使 用 带 有 GPU 计 算 显 卡 的 联 想 计 算 机,在Windows 10 系统实验设备下搭建实验平台。实验环境参数为:CPU 型号为 Intel(R)Core(TM)i7-9700,内存为 32.0GB,显卡型号为 NVIDIAGeForceRTX2080 Ti,显卡内存为 11.0 GB。使用的操作系统为 64 位的Windows 10 专业版系统,在开源深度学习框架 Tenso-rflow 下搭建网络模型。3.2评价指标实验中,模型预测准确度使用 3D 姿态估计领域中常用的关节位置误差评价指标(mean per jo
23、int posi-tion error,MPJPE),即通过计算角度空间中预测位姿与真实位置之间的欧氏距离来评判模型预测的准确度。具体算法流程如下:(1)将序列预测值 di与序列真实值 oi的欧氏距离作为预测误差值 ei,计算式为:ei=(di-oi)2。(2)将预测误差值 ei以列压缩,即让每一行的数值相加,矩阵压缩为一列,ei=(ei)姨。(3)利用 meanErrors 函数计算其平均值,均衡预测误差,进而评价预测值与真实值的波动程度,该值越小表示模型预测越接近真实值,ei=meanErrose(ei)。3.3数据集实验采用 Human3.6M 数据集18,该数据集由 4 台数码相机收集
24、的 360 万个不同人体姿势组成。数据集有 15 个训练动作,包括多种不对称的行走、坐姿、躺下姿势,各种类型的等待姿势以及其他类型的姿势,这些动作由 11 名专业演员完成。实验使用 5 号受试者进行测试,其余受试者进行训练和验证。其中,姿势数据是相对于骨架给出的,为了一致性和方便性,研究对所有参数使用相同的 32 个关节骨架。该数据集中人体行为信息数据记录形式为四元数形式,每一行代表一帧人体姿态图像,每一帧的四元数信息又包含了人体姿态的空间信息,提供了三维坐标中关节点的位置,位置数据是关节角度偏移所得到的。除 3D 关节位置外,该数据集还提供了运动表现参数,包含针对肢体之间的关节相对角度,方便
25、记录人体姿态数据。3.4实验结果实验对比了以 Seq2Seq模型为基础的 Free-running、Teacher-force 以及 Scheduled Sampling 三种采样机制下的行人预测准确度,不同采样机制下模型的预测误差(单位:dm)如表 1 至表 5 所示。表 1Smoking、Walking、Eating 误差数据对比ActionsSmokingWalkingEating80 ms160 ms320 ms400 ms80 ms160 ms320 ms400 ms80 ms160 ms320 ms400 msERD1.661.952.352.420.931.181.591.781
26、.271.451.661.80LSTM-3LR1.341.652.042.160.771.001.291.470.891.091.351.46Free-running(Residual)0.330.611.051.150.270.460.670.740.230.390.620.77Teacher-force0.330.560.971.000.430.680.921.030.330.610.971.00Scheduled Sampling0.490.480.550.470.410.400.450.460.440.440.460.47表 2Walking together、Sitting、Taki
27、ng photo 误差数据对比ActionsWalking togetherSittingTaking photo80 ms160 ms320 ms400 ms80 ms160 ms320 ms400 ms80 ms160 ms320 ms400 msFree-running0.280.570.870.910.441.051.491.630.300.600.941.08Teacher-force0.350.660.930.990.460.711.131.320.340.610.911.05Scheduled Sampling0.510.500.440.450.590.550.520.510.4
28、10.360.360.39杜薇袁等院 基于 Scheduled Sampling 采样机制的人体行为预测dmdm57天 津 职 业 技 术 师范 大 学 学 报第 33 卷表 3Walkingdog、Phoning、Waiting 误差数据对比ActionsWalking dogPhoningWaitingFree-running0.560.911.261.400.601.051.531.690.330.661.161.37Teacher-force0.630.991.281.450.651.211.641.810.380.701.151.37Scheduled Sampling0.700.6
29、90.580.580.750.630.550.540.560.510.460.4680 ms160 ms320 ms400 ms80 ms160 ms320 ms400 ms80 ms160 ms320 ms400 ms表 4Disscussion、Posing、Greeting 误差数据对比ActionsDisscussionPosingGreeting80 ms160 ms320 ms400 ms80 ms160 ms320 ms400 ms80 ms160 ms320 ms400 msFree-running0.310.671.011.090.360.711.121.480.751.17
30、1.741.83Teacher-force0.360.730.991.020.580.871.421.690.540.871.291.48Scheduled Sampling0.470.470.410.440.550.480.510.520.530.470.480.50与国内外经典算法进行了部分动作预测误差对比,在 Free-running 采样方式下,不同动作在 400 ms 以内的预测误差有所不同,对于活动范围小幅度集中于手部或动作存在周期性规律的动作,如 walkingtogether、walking、eating 等常规动作,预测误差能够达到 0.9 dm 左右。并且,在 80、160
31、、320 及 400 ms 内的误差存在较为明显的累积现象,误差数值随时间增加而变大。其余大多数动作 400 ms 的预测误差基本保持在 1.00 dm 以上。通过 Teacher-force 采样改进后,80160 ms 下的误差没有较大改善,与Free-running 采样方式下的预测值基本保持一致。在一些较为复杂、运动范围较小、没有周期规律性的动作,如 smoking、greeting、sitting、takingphoto 等动作,在 320 400 ms 的平均关节角度误差较Free-running 采样方式降低了 0.03 0.45 dm。但在purchase、walking do
32、g、posing 等动作上,前期动作序列与预测序列关键骨骼关节点信息不够集中,预测效果还是存在较大出入,误差逐渐变大的问题依旧明显。在 Scheduled Sampling 采样方式下,训练阶段融合真实值,能够在序列预测错误中较快纠正到真实序列状态,模型在 160、320、400 ms 下动作预测误差除sitting down(坐下)外均降低到 0.5 dm 左右。对比先前所采用的两种采样机制,动作序列的预测误差减小0.031.17 dm。然而,由于训练过程中真实值与预测值的混合训练,序列学习的长期依赖易丢失,输入动作序列存在微小差异动荡,导致预测过程中存在趋近取均的情况,使得序列预测初期有所
33、偏失。从表 2 至表 5中可以看出,在 80 ms 内的短期动作序列预测误差存在略微升高的现象,比其他采样机制下的预测误差值提高 0.20.4 dm,但总体来看,在 Scheduled Sampling采样机制下,动作序列的预测误差有明显改善。实验表明,Scheduled Sampling 采样机制可有效解决模型在训练和生成时输入数据分布不一致的问题,改善了循环神经网络短期预测中误差累积的问题,将除 walking dog、sitting down 以外大部分人类动作 400ms 内的短期平均关节角度预测误差降低至 0.6 dm 以下,其中 walking dog、sitting down 等
34、行为的预测精度也有小幅度的提升。因此,本文所提出的方法在行为预测精度的提高上具有一定的效果。4结语本文针对时序学习领域中的循环神经网络误差累积问题,在前人经验的基础上,对比不同采样机制在Seq2Seq 模型上的预测效果,提出 ScheduledSampling 采样机制下的 RNN 行为预测模型,着眼于循环神经网络训练过程中每步预测采用真实数据与预测数据相融合的方式,将连续采样时间内运行的循环神经网络梯度作用于时序监督学习。RNN 的额外输入是由一定比例的真实值与预测值混合构成的,即在训练初期以较大比例的真实值为输入,以便于缩小模型预测差距以及允许 RNN 对预测误差进行补偿,后期逐步融入表
35、5Purchase、Directions、Sitting down 误差数据对比ActionsPurchaseDirectionsSitting down80 ms160 ms320 ms400 ms80 ms160 ms320 ms400 ms80 ms160 ms320 ms400 msFree-running0.580.801.111.200.410.670.860.970.390.811.401.62Teacher-force0.630.871.201.280.430.650.830.940.510.941.331.49Scheduled Sampling0.530.480.510.5
36、20.510.490.470.470.930.910.830.81dmdmdm58第 2 期较大比例的预测值进行训练,改善模型自身泛化能力和预测准确度,提高网络在预测过程中的健壮性。在Human3.6M 人体骨骼关键点数据集上的实验结果表明,本文所提出的方法对人体行动预测有较高的准确度,将 400 ms 内行动预测误差基本控制在 0.5 dm 左右,预测精度得到了一定程度的提高,能够较好地获取和处理人体全局信息和上下文联系。在接下来的工作中,多人行为预测以及其所处环境对人类行为所带来的影响和变化将是研究的重点。参考文献:1 LIU M,TANG S Y,LI Y,et al.Forecasti
37、ng human-objectinteraction:joint prediction of motor attention and actions infirst person video C/VEDALDI A,BISCHOF H,BROX T,et al.European Conference on Computer Vision.Cham:Springer,2020:704-721.2 WANG Z R,LIU Z W,MA Q L,et al.Vision-based calibra原tion of dual RCM-based robot arms in human-robot c
38、ollabo原rative minimally invasive surgery J.IEEE Robotics and Au原tomation Letters,2018,3(2):672-679.3 CHENY.DesignandsimulationofAIremoteterminaluseriden原tity recognition system based on reinforcement learning J.International Journal of Modeling,Simulation,and ScientificComputing,2023,14(1):23-41.4 Z
39、HANG P F,LAN C L,XING J L,et al.View adaptive neu原ral networks for high performance skeleton-based human ac原tion recognition J.IEEE Transactions on Pattern Analysisand Machine Intelligence,2019,41(8):1963-1978.5MOHAMED A,QIAN K,ELHOSEINY M,et al.Social-STGCNN:a social spatio-temporal graph convoluti
40、onal neu原ral network for human trajectory prediction C/2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR).WA,USA.IEEE,2020:14412-14420.6 HUYNH M,ALAGHBAND G.Graph convolutional networkbased pose reconstruction and action recognition for humantrajectory prediction EB/OL.(2021-0
41、3-21).https:/arxiv.org/abs.7 CHU C T,HWANG J N,WANG S Z,et al.Human trackingby adaptive Kalman filtering and multiple kernels trackingwith projected gradients C/2011 Fifth ACM/IEEE Interna原tional Conference on Distributed Smart Cameras.Belgium:IEEE,2011:1-6.8 ARTHURP,NEUBIGG,NAKAMURAS.Incorporatingd
42、iscretetranslation lexicons into neural machine translation EB/OL.(2016-06-02).https:/arxiv.org/abs/1606.02006.9 GRAVES A,MOHAMED A R,HINTON G.Speech recogni原tion with deep recurrent neural networks C/2013 IEEE In原ternational Conference on Acoustics,Speech and Signal Pro原cessing.Vancouver,Canada:IEE
43、E,2013:6645-6649.10GREGOR K,DANIHELKA I,GRAVES A,et al.DRAW:arecurrent neural network for image generation C/Proceed原ings of the 32nd International Conference on InternationalConference on Machine Learning.New York:ACM,2015:1462-1471.11 LI C,LIAO X.Robust stability and robust periodicity ofdelayed r
44、ecurrent neural networks with noise disturbance J.IEEE Transactions on Circuits and Systems I:RegularPapers,2006,53(10):2265-2273.12 PROKHOROV D.Echo state networks:appeal and chal原lenges C/Proceedings.2005 IEEE International Joint Con原ference on Neural Networks.New York:IEEE,2005:1463-1466.13 OBST
45、O,RIEDMILLER M.Taming the reservoir:Feedfor原ward training for recurrent neural networks C/The 2012 In原ternational Joint Conference on Neural Networks(IJCNN).New York:IEEE,2012:1-7.14LI X L.Recurrent neural network training with preconditionedstochastic gradient descent EB/OL.(2016-06-04).https:/arxi
46、v.org/abs.15GUIROY S,VERMA V,PAL C.Towards understanding gen原eralization in gradient-based meta-learning EB/OL.(2019-07-28).https:/arxiv.org/abs.16BENGIOS,VINYALSO,JAITLYN,etal.Scheduledsamplingfor sequence prediction with recurrent Neural networks C/Proceedings of the 28th International Conference
47、on NeuralInformationProcessing Systems.NewYork:ACM,2015:1171-1179.17KIM J Z,LU Z X,NOZARI E,et al.Teaching recurrent neu原ral networks to modify chaotic memories by example EB/OL.(2005-01-18).https:/arxiv.org/abs.18 IONESCU C,PAPAVA D,OLARU V,et al.Human3.6M:large scale datasets and predictive method
48、s for 3D humansensing in natural environments J.IEEE Transactions onPattern Analysis and Machine Intelligence,2014,36(7):1325-1339.本文引文格式:杜薇,于雅楠,尹光华.基于 Scheduled Sampling 采样机制的人体行为预测 J.天津职业技术师范大学学报,2023,33(2):54-59.DU W,YU Y N,YIN G H.Human behavior prediction basedon Scheduled Sampling mechanism J.Journal of TianjinUniversity of Technology and Education,2023,33(2):54-59.杜薇袁等院 基于 Scheduled Sampling 采样机制的人体行为预测59