1、第 卷 第 期 年 月传 感 技 术 学 报 .项目来源:浙江省自然科学基金项目();浙江省教育厅科研项目()收稿日期:修改日期:,(,):,(),(),(),:;:基于 信号和深度学习的身份识别技术研究吴哲夫,肖新宇,林 超,龚树凤,方路平(浙江工业大学信息工程学院,浙江 杭州)摘 要:随着价格低廉 设备的广泛部署,无处不在的 信号在人体感知和身份识别方面得到了应用。现有基于 的人体身份识别大多依赖人的步态特征,需要人在 收发设备间来回走动,这种方法限制了识别的速度、规模和应用场景。针对这一不足,提出了一种静态、非接触式快速人体身份识别方法,首先基于人体生物特征影响的射频信号生成特有的信道状
2、态信息()指纹,这种静态的特征可以提高多人识别的效率;然后对信号进行数据增强和主成分分析()以减少训练时间和存储空间;最后将预处理后的数据进行多层深度卷积神经网络()处理,提取出辨别性特征并进行身份识别。实验结果表明,所提方法可以在多达 人场景下进行快速识别,平均识别精度为,优于现有的方法。关键词:人体身份识别;信道状态信息;深度卷积神经网络中图分类号:文献标识码:文章编号:()随着无线通信网络技术的飞速发展和 设备的快速普及,信号已经成为一种无处不在的通信和感知资源。目前,基于 的感知技术研究和应用已经覆盖无线感知的各个领域,包括人体追踪,室内健康和生命体征监测,人机互动和手势识别等等。人体
3、身份识别一直是人机交互、智能家居以及实现泛在智能计算服务的研究热点和关键技术之一。目前,摄像机、指纹设备、虹膜设备以及可穿戴传感器等已被广泛用于人体身份识别,但这些传感器尚存在一些实际应用问题。比如,基于指纹和基于虹膜的方法需要近距离接触;基于计算机视觉的方法被光照条件和视线特性所限制,同时还带来了隐私问题;基于可穿戴传感器设备的方法需要人穿戴额外的传感器设备,这会使穿戴者感到不适。而 设备凭借其部署的普遍性和成本效益,对感知目标无任何活动限制,没有数据采集时的光线和阻挡等条件限制,同时更有隐私安全保证,使得很多研究者把注意力放在了基于 的人体身份识别技术上。等利用 信号采集人体的步态特征来进
4、行智能且非侵入式的身份识别。等提出了一个基于深度学习的被动非接触式人体身份识别系统,在两种不同的室内环境下,两人时的准确率分别为 和,人时的准确率则降低到 和。虽然基于 的人体身份识别方法取得了一第 期吴哲夫,肖新宇等:基于 信号和深度学习的身份识别技术研究 定的成果,但仍然存在一些不足之处。一方面,大多数基 于 接 收 信 号 强 度(,)或信道状态信息(,)的人体身份识别方法都要求用户沿着预定路径来回走动,以记录 信号的变化数据。这种采集用户动作步态信号的方式费时费力,极大地限制了智能门禁等应用场景。另一方面,现有大多数基于 的人体身份识别方法主要是手动提取特征,然后使用传统机器学习的算法
5、训练分类器,最终的准确率远没有达到令人满意的地步,只有在 到 人等较少人数时,才能取得高于 的识别准确率。而且随着识别人数的增加,准确率会快速下降。为了克服基于用户动作步态识别方法的缺点,我们发现用户本身具有的个体生物特征(体态,体脂,肌肉率)会对电磁波造成幅度衰减和相位变化,从而生成具有代表性的 时间序列,可以被用来识别人体的身份。这一发现使得静态被动识别成为了可能,但只在一定程度上缩短了采样时间。如果想要取得较高的识别精度,它仍然需要用户长时间静止站立在收发设备之间以采集 样本数据。为了解决这一问题,我们利用 技术在同一时刻同一子载波上采集更多的数据。配合上专门设计的网络,我们可以快速地获
6、得更加准确的识别效果,这使得基于 的智能门禁系统成为可能。为了解决识别率随着人数增加而降低的问题,我们注意到快速发展的深度学习技术在提取人体生物特征直接相关的 信号表示上表现出了很强的能力,因此我们采用深度卷积神经网络(,)来提取信号特征,从而提升在大规模人群中识别人体身份的准确度。因此,本文提出了一种基于 的非接触式快速人体身份识别方法。首先,系统采集 的 数据并应用信号预处理算法去除异常值和噪音,压缩冗余数据,对数据进行增强以加强网络的泛化能力。然后,设计了一个反卷积输入生成网络,该网络以预处理后的 数据为输入,输出大小类似视觉图片的张量。生成的张量送入深度卷积神经网络中,通过网络提取出具
7、有判别性的特征。最后,使用一个多类别的分类器利用 学习出来的特征准确识别出人体身份。我们搭建了实验平台,并采集了样本数据进行训练测试验证,结果表明我们的系统取得了非常理想的识别效果。系统原理及实现方法整个系统的架构如图 所示,由四个主要部分组成:数据预处理、输入生成、特征提取和身份识别。系统包括两个设备,一个发射器广播 数据包,一个接收器捕获 数据包并提取出物理层中高分辨率的 数据,待识别人员被要求静止站立在收发设备之间。图 人体身份识别系统框图 数据预处理 幅度降噪原始 数据中的大量噪声和异常值会降低 感知的性能。为了减小这些高频噪声的影响,本文采用了五阶巴特沃斯低通滤波器(),因为在日常生
8、活中人的动作频率一般为 ,所以设置截止频率为 。图 表明在应用了滤波器后,高频的抖动噪声被去除了而幅度曲线的整体趋势没有受到影响。同时,可以清楚地看到被识别人员有着独一无二的幅度信号特征,而无人背景的 幅度几乎是不变的。不过,在身份识别时,收发设备间的距离通常在 左右,这种情况下的背景环境是相对稳定的,对应 曲线是平坦的,但是当收发设备距离较远时,外部环境会更加复杂,背景也会有相对的变化,对应 曲线会有一定抖动。数据增强数据样本数量较少时通常会导致后继的神经网络出现过拟合的问题。为了解决这一问题,同时增加网络在测试集上的泛化能力,本文设计了一个数据增强的方法。该方法的中心思想是主动向训练 数据
9、中加入抖动的,这样 深度卷积神经网络就可以适应数据的变化。数据增强算法的步骤如算法 所示。增强的片段 可以用如下公式表达:传 感 技 术 学 报第 卷图 原始和滤波后的 幅度对比图()()式中:,表示将整个数据集每 个元素分为一组,那么一共有 组,每 个元素计算其算术平均值 并作为增强的 片段,最终增强后的数据 可以表示为原始 和每个的拼接。实验结果表明,经过数据增强后的系统识别精度提升了约两个百分点。图 输入生成网络算法 数据增强输入:原始 样本,输出:增强后的 样本,()打乱 中样本顺序()()(,)降维预处理后的 数据仍然是一个高维度数据,很容易导致深度卷积神经网络的训练开销过大。记收发
10、装置中发射天线数为,接收天线数为,子载波数为,采用 网卡和 收发方案,一个 样本就有 个幅度数据值。如果以 的采样率采集 ,那么就有 个数据值。为进一步降低数据维度,减小运算量,我们采用了 来对数据降维,将每个 高维度数据投射到只保留较少的几个主要成分的低维度数据,同时还尽可能地保留数据的变化性。举个例子,如果我们只保留一个 样本 中的 个主要成分,的 幅度特征数据就会降低为原来的九分之一,即 个,这在很大程度上节约了时间和计算机存储资源,因此系统也能够更加快速地完成网络模型训练。输入生成三维的 矩阵 类似于数字图像,所以应用在计算机视觉方面的算法也可以用来解决 感知方面的问题。在大多数情况下
11、,收发天线的数量通常小于等于 个,即,。对于卷积神经网络架构而言,这种数据的尺寸太小,以至于不能直接送到深度卷积神经网络中。所以我们使用了一系列反卷积层来生成一个类似于大多数 网络输入图片大小的张量。如图 所示,八个反卷积层依次连接在一起,将第 期吴哲夫,肖新宇等:基于 信号和深度学习的身份识别技术研究 经过预处理后的 从 变换到,张量之间的箭头表示 模块。模块依次由一个反卷积层(),一个批归一化(),一个线性整流单元()构成。特征提取我们用 深度卷积神经网络作为特征提取模块。将输入生成模块产生的 输出张量送到 网络中,可以提取出明显或具有判别 性 的 特 征。如 图 所 示,在 进 入 第
12、一 个 之前,的输入张量首先经过一个有 个输出通道的二维卷积块,再经过一个 的最大值池化层。每一个 都包含许多,其结构相同并都由两个组合函数构成。在每一个 中,第一个卷积层的卷积核大小为,我们将之称为瓶颈层,第二个卷积层的卷积核的大小为。瓶颈层的主要作用是减少输入特征图的数量以提升模型的计算效率。图 修改后的 网络 对于每一个,前面一层输出的特征图作为输入,其自身输出的特征图用作所有后续层的输入。举一个例子,第 层就接收了它之前所有层,作为输入:(,)()式中:,指的是前面 到 层所有特征图的级联。这种层与层之间紧密联系的神经网络结构有更高的网络参数效率,并且可以使模型更加容易训练,其原因是层
13、与层之间的联系加快了信息流和梯度流在网络中的流动。除了 之外,还需要 来确保不同大小的特征图能够拼接成功。主要由批归一化层(),卷积层()和 平均值池化层()组成。图 身份分类网络 身份识别在人体身份识别阶段,我们使用了两个和上述 结构类似但参数不同的卷积块,如图 所示。经过卷积后的特征图再输入到自适应均值池化层,池化后的数据会被平铺成一维张量,并由最后的全连接神经网络预测出每个目标身份的概率大小,再由分数的高低判断进行识别归类。其计算公式如下:(,)()式中:是所有用户的数量,()计算的是分数向量 中最高分数的下标。实验设计我们对上述系统进行了实验设计和性能验证。具体实验设计由如下三个部分组
14、成:实验设置、数据采集和网络训练方法。实验设置我们使用了两台装有 无线网卡的笔记本电脑作为发射器和接收器。如图 所示,实验在一个 的房间里进行,房间里有一些日常使用的椅子和桌子。发射天线和接收天线之间的距离为 ,收发天线的高度为 。两台笔记本电脑均运行在 操作系统上,系统的内核均被修改过,来调整无线网卡驱动以使用。数据的发射中心频率为 ,每个采集到的 数据包含 个子载波。图 实验设置 数据采集我们招募了 位 到 岁的学生参与了本次实验。电磁波遇到不同人体后会产生不同的反射、散射和透射的变化,这种个体变化特征可以用传 感 技 术 学 报第 卷 数据表达。不同人的身体指标不同,我们用小米体质秤测量
15、了每一位学生的体质,包括肌肉量、体脂、水分、基础代谢和骨密度等参数。图 显示了所有学生的性别、身高、体脂和肌肉量的分布情况。如图 所示,学生被要求站立在 收发天线的中垂线上。每个人采集 ,也就是每人 个 样本。由于收发设备的不稳定性,最终采集的样本数量会上下浮动。之后将所有的 样本分为训练集和测试集,为训练集,为测试集,训练集和测试集之间的样本严格不重叠。图 采集数据的描述 网络训练方法我们用基于 的神经网络框架来实现深度卷积神经网络模型。整个训练集被分为了 份,每一个 包含 个训练样本。优化器用的是,初始学习率设置为,权重衰减系数设置为,一共迭代 轮,学习率根据训练轮数动态下降。我们使用了
16、结构,有 个,个 含有的 层数依次为、和,增长率设置为。试验结果分析 不同方法识别效果比较为了验证系统的高识别准确率,我们与,等模型进行了比较。、和 使用的是基于 的步态特征来识别人的身份;使用了 ()和 ()模型来学习代表性步态特征并编码时间信息以实现人体身份识别;提出了一种不需要人体进行任何操作的静态身份识别系统。图 显示了不同方法在 到 人时识别准确率情况,可以看出本文方法在识别人数和准确率方面相比这些方法有较大的提升。特别地,表 也表明我们的方法在最高 人的情况下仍然有高达 的识别准确率。与其他方法相比,该结果具有明显的优势。图 不同方法准确率对比表 不同模型性能比较模型人数准确率算法决策树柔性动作评价 近邻支持向量机图 人数变化对准确率的影响 不同识别人数的影响为了验证所提方法的可用性,我们研究了不同识别人数对算法的影响。如图 所示,虚线表示的是使用 的训练数据,而实线表示的是只使用的训练数据。当识别人数从 增加到 时,识别的准确率整体上呈现下降的趋势。准确率的下降可以解释为不同的人在体态和行为模式上有相似性。人数越多,这种相似性就越明显。但是,图 中曲线表明,在 数据用于训