1、国外电子测量技术北大中文核心期刊 :基于电子舌与 模型的大豆产地溯源快速检测陈立同高文金鑫宁张擎王志强(山东理工大学计算机科学与技术学院 淄博 ;淄博市工业数字经济发展中心 淄博 )摘要:根据不同产地大豆成分特征含量的差异,提出了一种基于电子舌结合元学习()卷积神经网络(,)组合模型实现对大豆产地溯源的快速检测的方法。采用一维卷积神经网络对电子舌信号进行特征提取和分类识别,针对 模型难以适应新任务,依赖大量数据训练等问题,采用模型无关元学习算法(,)在预训练数据集上对 进行预训练,为 获得一个全局最优初始化参数。在此基础上,利用微调策略实现对新类别少量样本的快速适应与学习,最后通过模型实现查询
2、样本的分类预测。实验结果表明,模型测试的准确率、召回率、精确率、分别达到 、。研究为大豆产地溯源检测提供了一种快速的检测方法,并为仿生智能感官技术在农产品检测领域提供新的研究思路。关键词:大豆;产地溯源;电子舌;元学习;卷积神经网络中图分类号:文献标识码:国家标准学科分类代码:(,;,):,(),(),:;收稿日期:基金项目:山东省自然科学基金()、教育部科技发展中心产学研创新基金()项目资助引言大豆是世界上种植最广泛的豆科作物,是植物蛋白质和油脂的主要来源。大豆的营养成分丰富,但不同产地的大豆在营养成分、含量组成等方面存在很大差别。近年来,农产品以次充好、以假乱真等问题日益突出,以地域特征为
3、主要标识的农产品产地溯源问题越来越受社会的高度重视。目前对大豆产地溯源检测的方法主要有感官分析法和理化分北大中文核心期刊国外电子测量技术析法。感官分析法主要依靠检测人员的味觉、嗅觉、视觉等感官进行分辨,容易受到外在环境的干扰。理化分析方法主要采用近红外光谱法、指纹图谱技术等,但是这些方法存在仪器体积大,价格昂贵,操作复杂、检测周期长等问题,无法满足大豆产地溯源快速检测的需求。电子舌是一种利用多传感器阵列结合模式识别技术对液态样本的“指纹图谱”进行分析的仿生学检测技术,具有操作简单、检测迅速、仪器体积小、成本低、检测结果客观性强等特点。目前,电子舌已经广泛应用于食品检测、中药材检测、农产品检测等
4、领域中。模式识别技术对于电子舌的检测性能具有重要的作用,其主要功能包括特征提取与分类识别。特征提取主要作用是从复杂的电子舌信号中提取关键特征,从而达到压缩信号维度,减少数据冗余,捕捉差异关键信息等作用。刘泓等利用主成分分析对蛋白肽电子舌信号进行特征提取。等利用偏最小二乘判别分析对果汁的电子舌信号进行特征提取。史庆瑞等 使用离散小波变换提取橙汁的电子舌关键特征。然而这些方法都是基于人工特征设计,效率较低,无法提取信号中的深层抽象特征。分类识别是基于所提取的特征信息对信号进行分类辨识的方法,等 使用 神经网络(,)对稻米的电子舌信号进行指标的区分。等 使用极限学习机对蜜桔的电子舌信号进行品质区分。
5、殷廷家等 使用有线判别分析对枸杞电子舌信号进行产地分辨。这些方法虽然取得了较好的分类效果,但是主要基于浅层机器学习模型构造,存在数据表征能力差,泛化能力不足等缺点。深度学习模型是一种能够自动对数据进行特征提取和分类,实现“端到端”模式识别的方法。由于其能够更好的对数据进行表征,近年来,深度学习也被尝试应用于对电子舌信号进行分析。然而大多数深度学习模型的应用依赖于大量标记数据的训练和昂贵的计算资源,而当前电子舌信号由于采集难度大、信号复杂,尚未有可供使用的大规模样本集。当训练样本数据量不足时,深度学习模型极易出现过拟合和泛化能力差等问题。元学习是指“学会如何学习”,即如何利用知识和经验来指导新任
6、务的学习,从而让机器具备学习的能力。元学习通过学习相似任务之间的共性特征部分获取经验,并利用学习到的经验对新任务进行微调,从而无需从头开始学习就可以很好的实现对新任务的快速适应与泛化。等 将元学习应用于机械故障诊断领域,对于不同工作条件下的轴承故障信号进行检测,解决了由于样本稀缺和获取困难等导致的模型泛化能力差等问题。颜康等 将元学习应用于雷达电磁识别领域,解决了由于畸变雷达信号样本稀缺而导致的模型识别准确率较低等问题。对于少样本学习通常会面临新数据上容易发生过拟合的问题,模型 无 关 元 学 习 算 法(,)很好的解决了这个问题。该算法是元学习的一种基于强泛化性的初始化参数元学习方法,主要思
7、想是将网络参数梯度下降优化过程和优化损失函数过程两个任务相分离,从而获得较好的泛化性能力。在训练过程中通过双层梯度下降方法获得模型的初始化参数,对于数据样本有限的不可知任务具有更好的分类性能。针对不同产地大豆快速溯源检测问题,本文提出一种基于电子舌与 卷积神经网络()模型相结合的检测方法,首先采用电子舌系统采集多个不同地区大豆样本的指纹图谱信息。然后采用一维卷积神经网络()对电子舌信号进行特征提取与分类识别,针对由于训练样本数量不足而导致模型出现过拟合和泛化能力差等问题,使用 在预训练数据集上对 进行预训练,使其获得全局最优的模型初始化参数,从而提高模型训练的精度与泛化能力。然后,使用少量新类
8、别电子舌信号对训练好的模型进行微调,以获得较好的数据拟合效果,并自动实现对电子舌信号的特征提取。最后,通过 全连接层对提取的特征信息进行分类鉴别,实现大豆产地的快速分辨。方法 伏安电子舌系统本文采用的实验室自主研发的伏安电子舌系统,其结构图所示,系统由个主要部分构成:)传感器阵列,包括工作电极(铂、金、钛、钯、银、钨、镍和玻碳)、参比电极()、辅助电极(铂);)信号调节电路,用于控制三电极系统中的恒压位电势;)数据采集卡,用于产生激励信号,并通过模块将数字信号转换成模拟信号,利用模块将电子舌响应信号 转换 成数 字 信 号;)上位机软件,用于操作 卡并分析采集的信号。系统采用的大幅方波脉冲激励
9、信号如图所示,扫描频率为 ,工作电势范围为 ,阶跃电位为。系统工作时,首先上位机软件操作 卡发出激励信号,将信号通过信号调节电路稳定施加在传感器阵列上。在激励信号的作用下,工作电极表面发生电化学反应并产生微弱的电流响应信号。该电流响应信号经过信号调理模块放大滤波后,通过数据采集卡采集至上位机进行模式识别分析。图电子舌实物国外电子测量技术北大中文核心期刊图脉冲激励信号 元学习元学习是一种高层次的跨任务学习策略。元学习的主要目的是让模型获得学习元知识的能力。元知识是指模型在训练过程之外可以学到的知识,如模型的超参数、神经网络的结构和优化器等。元学习中主要有元学习器与基础学习器,一般将元学习的学习算
10、法称为元学习器,被优化的对象称为基础学习器,本文为 深度学习模型。元学习器通过大量训练任务训练基础学习器,使得基础学习器能够利用少量样本经微调后就能快速适应新类别的学习任务。元学习训练过程主要分为元训练和元测试两个阶段,元训练和元测试都以任务为基本单位,每个任务由两部 分 组 成。支 持 集()和 查 询 集()。元训练阶段,利用预训练数据集作为元训练阶段的训练数据集 ,从中随机选取个类别数据,每个类别中随机选取个标注样本,一共包含个样本组成支持集,再从这个类别剩余样本中随机选取一批样本组成查询集,支持集和查询集组成 每 个训练任务。以任务为处理对象构建的分类任务即是 分类问题。每个任务的支持
11、集用来训练基础学习器,使模型适应当前分类任务,查询集则通过训练好的基础学习器,计算出其损失函数,并通过 、随机梯 度 下 降()等 优 化 器 对 损 失 函 数 进 行 最 小化,决定梯度下降的方向,更新模型初始化参数。元测试阶段,新类别数据集作为测试数据集 生成测试任务,新任务中的样本类别是在之前学习的任 务中没有出现的。每个任务也包含支持集和查询集,使 用每个任务中的支持集对元训练阶段已经训练好的网络模型进行少量几次训练达到微调模型效果,然后 使 用查询集去测试已经进行优化的模型分类效果,最 终 实现模型良好拟合与泛化性能。算法 是一种基于参数优化的元学习方法模型,模型通常由内循环与外循
12、环组成。首先,建立一个由参数化卷积神经网络模型。内循环阶段,以任务为单位,在每个任务的支持集上计算参数的梯度并保存更新后的参数。使用交叉熵损失函数计算损失,计算公式为:(,)()()()()式中:和是任务中取出的样本和对应的标签;是初始化参数为的卷积神经网络模型;是交叉熵损失函数。当执行一个任务时,通过在任务的支持集上使用初始化参数进行梯度下降并更新参数。然后在查询集上测试当前模型性能并计算当前任务的损失。采用 计算梯度并更新参数,模型参数变为:()()式中:是第个任务的支持集计算一次得到的参数更新;代表学习率;()是损失函数对初始化参数的梯度。模型参数优化是通过根据任()中的任务样本训练出来
13、的(),然后计算所有查询集上的损 失之 和()(),获得在查询集上的最小总损失函数:()()()()()获得最小总损失函数后,在外循环阶段,采用第次梯度下降一次更新初始参数,因此外循环参数更新如下:()()()式中:为元学习率;()()为查询集上任务对初始参数的最小损失梯度。这样不断通过内循环与外循环训练,最终能在数据集上获得该模型全局最优的初始化参数。是一种前馈神经网络,具有局部连接特性和权值特性,能够自动对原始数据进行局部空间特征提取。电子舌信号为一维时序信号,本文采用 对电子舌信号进行分类与识别。其结构主要包括输入层、卷积层、池化层、全连接层和输出层组成。本文 模型使用卷积神经网络作为基
14、础学习器模型,模型包括 个卷积块作为特征提取模块,个全连接层(层)作为分类器。每个卷积块包括个卷积层 、个 层、个最大池化层()和个非线性激活函数 。其中,每个卷积块之间通过最大池化层来连接,最大池化层的卷积核大小为,通过最大池化来缩减模型大小,提高计算速度,同时提高所提取特征的鲁棒性。模型 模型的工作流程如图所示。)利用电子舌系统分别采集样本溶液的指纹图谱信北大中文核心期刊国外电子测量技术图 模型工作流程号,并将电子舌信号数据集预处理后并按照比例划分为支持集与查询集随机组成多个任务。)元训练阶段,利用元学习器学习算法在预训练数据集 上对基础学习器 进行训练与测试,为 获取全局最优的初始化参数
15、。)元测试阶段,在参数的基础上,使用新类别数据集 中的支持集来微调训练好的模型以获取微调后的参数,然后使用查询集测试模型获取分类结果。)通过不同网络模型在跨任务训练与测试的耗时对比,判断 模型快速适应新任务的能力。)比较不同模型的分类性能效果,使用准确率()、召回率()、精确率()、等相关指标对模型进行性能分析,判断模型对不同产地大豆快速溯源的检测效果。实验与讨论 实验材料与样本处理使用电子舌系统采集的不同地区的大豆电子舌信号作为元测试阶段的新类别数据集 。使用黑龙江省绥化市、山东省聊城市、江苏省宿迁市、湖南省衡阳市、内蒙古呼伦贝尔市个不同地区的大豆作为样本。选取无破损、无虫蚀饱满的大豆样本各
16、取,分别使用高速粉碎机将样本粉碎成粉末状,选取 大豆 粉 末 与 蒸馏水混合并充分搅匀,形成 质量浓度的样本溶液 ,样本溶液经滤纸两次过滤后使用电子舌系统进行信号采集。每一个地区的大豆样本采集 样本,共采集 个原始样本数据。按照 的比例划分为支持集与查询集,用于元测试阶段进行模型微调与评估。实验中利用实验室自采的小麦样本电子舌信号 作为元训练阶段的预训练数据集 。中包括个类别,每类中的样本数量为 ,共采集 个原始样本数据。本文将 按照 的比例划分为支持集和查询集,并随机组成多个任务,用于元训练阶段的训练与测试。电子舌响应信号伏安电子舌系统的个工作电极产生的响应信号如图所示,从图可以看出,不同产地大豆的电子舌响应信号存在明显差异,在不同金属电极的催化作用下,样本溶液发生电化学反应,每个电极区域都表现出样本溶液独特的“指纹图谱”信息。每个电极产生 个数据点,每个样本共得到 个数据点。图不同产地大豆的电子舌响应信号 数据预处理原始电子舌信号存在噪声和奇异点,直接用于分析过程会对分类结果产生不利影响,采用式()进行归一化预处理处理。()国外电子测量技术北大中文核心期刊式中:代表信号中第个采样值