1、现代计算机Modern Computer第 28 卷 第 24 期2022年12月25日文章编号:1007-1423(2022)24-0029-07DOI:10.3969/j.issn.1007-1423.2022.24.005基于自适应图像增强和CNN的少数民族服饰图像分类研究候红涛1,2,汪威1,2,申红婷1,刘宽1,2,杨秀璋1,罗子江1(1.贵州财经大学信息学院,贵阳550025;2.北京盛开智联科技有限公司,北京101300)摘要:针对传统的少数民族服饰图像分类采用人工处理,无法满足信息化时代对图像自动分类的要求问题,提出了一种基于自适应图像增强和卷积神经网络的少数民族服饰图像分类算
2、法。该算法通过计算复杂环境下少数民族服饰图像的平均亮度,采用不同的算法进行图像增强,提高图像对比度,降低噪声,并利用卷积神经网络学习不同少数民族服饰图像的特征,实现少数民族服饰图像的自动分类。实验结果表明,所提出的算法提高了准确率、召回率和F1值,能够有效地对白族、苗族、蒙古族、维吾尔族和藏族服饰进行分类和识别,为少数民族服饰的信息处理奠定了良好的基础,也为民族文化的传承和保护提供了支持。关键词:卷积神经网络;自适应图像增强;图像分类;少数民族服饰;深度学习基金项目:国家自然科学基金(11664005);贵州省科技计划项目(黔科合基础 2019 1041 号,20201Y279,2020 1Y
3、021);贵州省研究生教育创新计划项目(黔教合YJSCXJH 2019 066);贵州省教育厅自然科学基金项目(黔教合KY字 2021 135);贵州财经大学在校学生(研究生)科学研究项目(2021ZXSY113)0引言少数民族服饰传统文化是整个中华民族文化的瑰宝,对其纹理样式、绣花雕饰、图腾标志、头饰绣花的研究,能有效地保护和传承少数民族服饰传统文化,并对将民族元素融入现代时尚中起着重要的作用1-4。当今社会,许多学者对非物质文化的传承和保护进行研究,但这些研究大多数都还停留在传统的人工处理阶段,通过博物馆收藏服饰和人工分类来进行静态保护,较少有人对这些服饰进行自动分类和识别研究5。面对海量
4、的少数民族服饰图像,人工分类方法效率低且成本高,无法满足信息化时代对少数民族服饰图像自动分类提出的新要求。同时,受光照强度、拍摄角度、纹理精小、背景复杂等因素影响,少数民族服饰图像识别率较低,传统的图像分类效果不理想。因此,利用数字化方法和计算机技术来自动提取少数民族服饰元素,对海量民族服饰图像进行分类具有重要的研究意义和应用价值6。本文提出一种基于自适应图像增强和卷积神经网络的少数民族服饰图像分类算法,通过计算复杂环境下的少数民族服饰图像的均值亮度来判断,采用不同算法进行图像增强处理,使图像具有更强的鲁棒性和适用性;接着利用卷积神经网络训练不同少数民族服饰图像的局部特征,学习少数民族服饰的不
5、同风格和纹理特色,最终实现服饰图像的自动分类。该技术也可以广泛运用于各领域的图像分类处理。1相关研究工作随着计算机视觉迅速发展,图像分类技术已广泛应用于各行各业,比如农产品检测7、车牌识别8、医学图像分类9、车型分类10、手写文字识别11、人脸表情识别12、疲劳驾驶检测13等。目前,将计算机视觉技术应用到民族服饰文化研究还处于初步阶段,部分学者提出了相关方法,主要是通过KNN、SVM、决策树等机器学习算法对少数民族服饰图像进行分类4,基本流程如图1所示。利用计算机提取民族服饰图像的灰度、颜色、纹理、形状等底层特征,再用训练好的分类器进行预测,以代替人类的视觉判断。29现代计算机2022年图 1
6、传统的图像分类算法流程图陈金广等14采用 SIFT 和 SURF 算法提取清代宫廷服饰图案,并通过最优节点优先算法对所提取的特征匹配点进行确认。Hu等15采用分类算法对服饰的底层特征进行分析。吴圣美等4通过融合多任务学习和人体检测来识别少数民族服装。程远菲5利用支持向量机建立分类模型,对提取的HOG和融合特征进行少数民族 服 饰 分 类 识 别。曹 春 梅16改 进 了 基 于RANSAC 的特征点匹配算法,从而提升民族服饰图案识别准确率。Hidayati等17通过基于视觉可区分的服装设计元素算法自动分类不同风格的服装。Bossard等18采用随机森林和SVM算法对服饰图像进行分类,并提出一套
7、完整的检测流程。但上述方法缺乏对少数民族服饰的细节特征学习和语义信息分析,并且由于少数民族服饰图像受人体姿势、拍摄角度及视觉遮挡等影响,降低了图像分类和识别的准确率。2图像分类模型设计2 2.1 1算法整体框架算法整体框架本文所提出算法的整体框架如图2所示。(1)首先自定义爬虫采集少数民族服饰图像,构建包含了 5种少数民族服饰的图像数据集,并按照训练集和测试集73的比例进行随机划分。(2)其次,分别对训练集和测试集图像进行预处理和自适应图像增强操作,判断图像的光线、亮度、背景等复杂环境,通过图像增强过滤噪声。(3)接着提取少数民族服饰图像的特征,并利用卷积神经网络训练分类器,获取各少数民族服饰
8、的细节信息和纹饰特征。(4)最后利用训练好的分类器对待识别图像进行预测,判断其少数民族服饰图像所属的民族。2 2.2 2基于卷积神经网络的图像分类基于卷积神经网络的图像分类卷积层旨在提取输入图像的数据特征。通过卷积核的滑动来过滤输入图像的各个子区域,将过滤器与对应位置的图像像素做乘积求和运算,其卷积操作如公式(1)所示。yi=w1 x1+w2 x2+wi xi(1)式中,yi表示卷积后的结果,wi表示卷积核的参数,xi表示原始图像的像素值。CNN将输入图像卷积的过程映射到神经网络中,如公式(2)所示。xlj=f(i Mjxl-1i wlij+blj)(2)其中,wlij表示第l层的第j个特征图
9、所对应的卷积核,blj表示输出特征图的偏置项,xl-1i表示第l-1层的第i个特征图,Mj表示选择的输入图的集合,f表示激活函数。池化层旨在降低数据维度,减少数据量,同时能保持图像特征统计属性并有效避免过拟合现象。池化层的计算公式如(3)所示。xlj=f()ljdown(xl-1i)+blj(3)其中,lj表示对应的系数,blj表示第l层第j个特图 2本文算法的整体框架图图像预处理自适应图像增强卷积神经网络学习白族特征提取维吾尔族少数民族服饰图像测试集少数民族服饰图像测试集自适应图像增强分类器苗族藏族蒙古族特征提取分类器图像预处理 30候红涛等:基于自适应图像增强和CNN的少数民族服饰图像分类
10、研究第24期征图的偏置项,down表示采样函数。本文的图像分类模型如图3所示,输入图像为5个民族的彩色女性少数民族服饰图像,经过第一个卷积层并调用ReLU函数激活,输出维度为282820,再经过第一个池化层处理,输出维度为 141420;经过第二个卷积层并调用ReLU函数激活,输出维度为101040,再经过第二个池化层处理,输出维度为5540;通过两个全连接层并调用Dropout解决过拟合现象;最终输出层为5个特征,分别代表白族、苗族、蒙古族、维吾尔族和藏族的服饰图像分类结果。该算法通过图像多层卷积和池化,逐渐提取深层次的图像特征和少数民族服饰细节信息,从而优化图像分类结果。2 2.3 3自适
11、应图像增强算法自适应图像增强算法本文提出算法在进行卷积神经网络计算之前,针对不同的环境进行自适应图像增强处理。在原有图像分类基础上增加了图像亮度溢出值的范围判断和图像增强处理,为进一步的少数民族服饰图像分类提供良好的环境,提高分类准确率。该算法基本流程如图4所示,其过程为:首先获取图像像素的均值亮度,再由均值亮度判断少数民族服饰是否进行图像增强处理;当均值亮度大于等于180时,图像处于曝光状态,明暗程度不均衡,此种情况采用伽马变换降低对比度,提高图像明暗程度,实现图像增强处理;当均值亮度在100至180之间时,图像是足够清晰的,不需要进行图像增强,直接输入原始图像进行后续的图像分类;当均值亮度
12、在 40 至100之间时,图像明暗程度会出现暗部区域较广泛的现象,采用自动色彩均衡算法处理,提高对比度并增强色彩均衡;当均值亮度小于40时,图像明暗程度趋于暗部,此时采用彩色直方图均衡算法进行图像增强,能够在提高图像对比度的同时,保留原图像的细节。图 4自适应图像增强算法流程图2 2.3 3.1 1伽马变换伽马变换伽玛变换主要用于图像增强或校正。其原理是降低灰度过高的像素值,增强灰度过低的像素值,从而增强图像的对比度。如公式(4)所示。s=c r(4)图5展示了白族服饰图像经过伽马变换前后的对比效果,拉伸后的图像色彩更均衡,细节图 3基于卷积神经网络的图像分类模型白族(0)Convolutio
13、n+ReLUConvolution+ReLUPoolingPoolingOutput PredictionsFullyConnectedFullyConnected苗族(0)维吾尔族(0)蒙古族(0)藏族(1)31现代计算机2022年更清晰,且保真程度极高。(a)原始图像(b)图像增强后效果图 5伽马变换图像增强前后对比图2 2.3 3.2 2自动色彩均衡算法自动色彩均衡算法Retinex算法是典型的图像增强算法,它根据人类视网膜和大脑皮层模拟对物体颜色的波长光线反射能力而形成,对图像边缘有一定自适应增强。自动色彩均衡(automatic color enhancement,ACE)算法是在
14、Retinex 算法的理论基础上提出的,旨在利用目标像素点和周围像素点的明暗程度及关系来校正图像,实现图像的对比度调整。其计算公式如下所示:Y=()g()I(x0)-I(x)w(x0,x)()w(x0,x)(5)其中,w是权重参数,g是对比度调节参数,其计算方法如公式(6)所示,a表示控制参数,该值越大细节增强越明显。g(x)=max()min(ax,1.0),-1.0(6)图 6是苗族女性服饰图像经过 ACE算法图像增强处理后的对比图,ACE算法增强原图像的明暗程度,同时更好地保留原图像的细节信息,比如图6中的苗族银饰。(a)原始图像(b)图像增强后效果图 6苗族服饰图像增强前后对比图2 2
15、.3 3.3 3彩色直方图均衡化算法彩色直方图均衡化算法民族服饰图像的直方图均衡化处理能增强图像的对比度,提高图像的细节。当均值亮度小于40时,图像明暗程度趋于暗部,此时采用彩色直方图均衡算法进行图像增强,能够在提高图像对比度的同时,保留原图像的细节。图7展示了蒙古族服饰彩色直方图均衡化处理前后的效果图。(a)原始图像(b)图像增强后效果图 7彩色直方图均衡处理前后对比图3仿真实验分析3 3.1 1实验数据和环境实验数据和环境本文利用网络爬虫采集并挑选了5000张不同女性少数民族服饰的图像,包括白族、苗族、蒙古族、维吾尔族和藏族。同时,将训练集和测试集按73的比例随机划分,得出如表1所示的图像
16、数据集。表 1实验数据集类标01234总计民族白族苗族蒙古族维吾尔族藏族数据集100010001000100010005000训练集7007007007007003500测试集3003003003003001500实验采用 GPU 搭建 TensorFlow 框架实现,程序利用Python 3.6编写,并进行了详细的仿真对比实验。3 3.2 2评价指标评价指标评价指标为准确率(Precision)、召回率(Recall)和F1值(F1-measure),最终结果为10次图 32候红涛等:基于自适应图像增强和CNN的少数民族服饰图像分类研究第24期像分类实验结果的平均值。计算公式如下:Precision=NS(7)Recall=NT(8)F1-measure=2 Precision RecallPrecision+Recall(9)其中,N表示正确分类的少数民族服饰图像数,S表示实际分类的少数民族服饰图像数,T表示真实存在的少数民族服饰图像数。Precision 反映图像分类为正确目标中真正的正样本比重,Recall反映图像分类为正确目标中正样本占总的正样本比重,F1-measure是准