1、2023年8月 第36卷 第16期理论研究084设计DESIGN兰州理工大学设计艺术学院 王 鹏 邢志红基于大数据的产品设计意象语义挖掘研究综述THE METHOD AND DEVELOPMENT OF SEMANTIC MINING OF PRODUCT DESIGN IMAGE BASED ON BIG DATA引言在大数据、人工智能、万物互联的今天,信息-物理-机器-人类将组合成四元的数据世界,数字化、网络化、智能化将推动设计方法的大变革1,设计创新将更依靠对海量设计信息数据的获取和分析,大数据挖掘技术被广泛应用到创新设计中。对于设计师来说,产品设计不仅仅关乎产品本身,更多的是关乎产品设
2、计语境中所包含的意象。通过对产品设计意象的挖掘,以此来满足消费者的感性需求。因此如何精准获取更多的设计语义信息以及设计实施后用户对产品感性认知的程度,将大大提高设计师的效能和成功率,将大数据挖掘技术应用到设计感性认知的获取具有重要意义。用户对产品设计的认知通常用设计意象语义来表示,设计意象语义信息大量存在网络评论文本中。在意象语义挖掘过程中,大量的文本信息从网络挖掘出来,其信息量十分庞大。如果对其直接采用传统的信息处理方式,就需要耗费大量的时间,同时其精确度较差,较难符合未来的智能设计需求。因此面向智能设计的数据挖掘方法需要高效率、高精度的大数据爬取处理能力,为后续设计意象语义的准确聚类提供技
3、术支持。通过本体或语义网模型,对产品设计意象语义进行概念化定义后构建知识图谱,以此实现知识的共享和重用。一、意象语义挖掘的流程随着经济的发展,用户的消费理念也发生了改变,用户不仅关注产品本身的品质,还注重产品给自己带来的精神文化需求2。因此在产品设计时,设计人员不再单一地注重外观给用户的视觉表达,而是更关注产品能够给客户的精神内涵。而这种精神内涵在语义上的表达方式就是意象,主要表现为客户对产品的心理认知在思维空间里能自发地生成对被认知物体的形象,这种形象是根据用户的感觉来源来传递物体的主观表象信息3。在产品设计中,产品的造型、材质、色彩等因素对其多种感觉器官刺激所产生的心理反应和情感表现,反映
4、了用户对于产品的喜好程度和评价准则,是用户直觉和思维反应的综合体,是人们认知产品的基本方式,而这种认知通过语义的形式对产品外在形态所表现的意象进行理解。本文基于大数据背景,利用相关算法挖掘出一种更加符合产品语义的意象,从而帮助设计师设计出一种充分满足广大用户感性需求的产品,因此,提出意象语义挖掘流程主要包括意象语义获取、意象语义分析处理和意象语义可视化表征三个流程,如图 1 所示。摘要:在产品创新设计过程中,设计意象语义挖掘一直是研究热点。通过对大数据的挖掘,能使设计师获取更准确的设计意象语义,从而为产品创新设计的研究起到有效的数据支撑。对大数据挖掘方法进行对比研究,总结了产品设计意象语义的挖
5、掘机制;通过语义概念化,对产品设计意象语义进行形式化表征,形成知识图谱,为产品设计知识的共享与重用提供了思路和方法。总结出以马自达汽车设计为对象的产品设计意象语义挖掘流程,并通过对意象语义的概念化形成知识图谱。关键词:产品设计 意象语义 大数据 语义挖掘 知识表征中图分类号:J03 文献标识码:A文章编号:1003-0069(2023)16-0084-04Abstract:In the process of product innovation design,design image semantic mining has always been a research hotspot.Thro
6、ugh the mining of big data,designers can obtain more accurate design image semantics,thus providing effective data support for the research of product innovation design.knowledge,thus effectively supporting the research on intelligent design.Using the methods of comparative study of big data mining
7、methods,the mining mechanism of product design image semantics is summarized.Through semantic conceptualization,product design image semantics were formally represented,and a knowledge map was formed,which provided ideas and ideas for the sharing and reuse of product design knowledge.research and su
8、mmarize the viewpoints of relevant literature,and comprehensively analyze and expound the characteristics of image semantic mining methods in the context of big data,the process of image semantic mining,semantic analysis processing and visual representation methods.The process of product design imag
9、e semantic mining with Mazda car design as the object is summarized,and a knowledge graph is formed by conceptualizing the image semantics.Keywords:Product design Image semantics Big data Semantic mining Knowledge representation二、意象语义挖掘的方法(一)意象语义的获取意象的获取不仅可以表达产品所含有的语义,还能反映出消费者对产品的喜好。挖掘出用户对产品的偏好需求,能为
10、产品创新设计提供需求来源和设计方向4。目前,在意象获取方面主要采用的是传统的人工测量法(心理认知测量法、生理指标测量法)以及基于大数据的网络评论文本挖掘法。通过传统的方法获取用户的心理认知意象,虽然简单快速,但主观性较大,不能客观地反映样本的意象;而通过网络爬虫获取的文本数据,数据量大,能够反映产品的大部分意象,另外,且能自动对采集后的数据过滤掉重复信息,以此筛选出图 1 意象语义挖掘流程理论研究085设计DESIGN更准确的意象。网络文本挖掘法中爬取工具较多如有 Rapid Miner、Octoparse 以及 Python,因此需根据不同爬取的场景中选取不同的爬取工具,这样爬取的效率将会提
11、升。以 Python 为例,其爬取语法清晰,易于操作纯文本文件,使用广泛,效率高。而且能反映出消费者对产品的喜好,为产品的创新设计提供需求来源和意象设计方向。以马自达汽车设计为例,意象最早应用在感性工学理论,而马自达汽车是运用意象设计方法的典型,旗下众多乘用车通过意象设计形成家族化,根据魂动式设计理念,马自达系列乘用车设计风格体现了家族化的设计意象,即在造型上运用“流线型”来表达“运动感”,通过赋予“魂动红”的色彩更体现了马自达的“大气”的风格。在进行产品创新设计时,需从目前已有汽车的造型、材质以及色彩等方面去分析用户的感性需求,若采用人工的方式搜集样本的语料,效率低且会遗漏高质量的意象语义。
12、若通过 python 爬虫程序中对相关网页网站的在线评价文本进行抓取,能够爬取大量的语料。这些大量语料客观地反映出用户对马自达汽车的喜好偏向,以此为产品的创新设计提供需求来源和意象设计方向。(二)意象语义分析处理1.语义数据预处理在大量搜集意象语义信息时,会有许多重复的语义,在筛选时不能够很好地选择具有特征的意象语义,因此要进行多方面的数据处理,其中包含文本筛选、文本分词、去停用词、词频统计等步骤。通过数据清洗后,可以为下一步分析数据做好充分的准备。但是产品设计意象的领域性较强,一般的预处理工具适用性较差,而通过 Jieba工具进行处理,准确率可达 90%以上。而产品的设计意象主要是对产品的外
13、在综合品质进行描述,会存在较多的介词、助词、副词等一些没有实际意义的词。Jieba 在处理语义文本时能根据词性将文本语料进行分词,形成设计意象词汇。对意象词汇进行词频统计时需去除无实际意义的词,去除后统计词频,得到符合马自达设计意象词汇,如表 1 所示。2.聚类降维聚类在数据挖掘中是一种重要的挖掘技术,其能够根据数据相似性对一组看似混乱无序的原始数据进行自动分类,从而使得分析人员能够根据分类结果快速高效地了解数据的内部结构和分布特征,大大减轻了分析人员的数据认知负担4。将海量意象语义数据进行聚类降维分析,从而选出具有代表性的特征词以及特征语义。主要方法有 K-NN 算法、K-means 聚类法
14、以及主成分分析法。(1)K-NN 算法K-最近邻算法(K-NN,k-nearest neighbor)是一种监督学习算法,根据样本距离来提取和分类所有可用案例。分类后只需要简单地存储训练实例,即可完成分类5。由于产品设计意象语义的丰富性,词与词之间的关联性复杂,根据 K-NN 分类算法的特性,其需要分析测试实例与对应的训练集中的全部实例间的相似程度,故而其不能高效地处理大数据时代所产生的海量数据6。(2)K-means 聚类法K-means聚类法是将采集到的大量复杂数据集合分割成几个类,这些类内部都有一个中心,内部各个元素都是围绕着它,元素与中心的距离较近,代表着相似程度,而类与类之间的距离相
15、距较远7。人们对于产品的认知都是具有模糊性的,各个产品设计元素给人不同或者相同的意象认知,这些意象认知复杂交揉。通过聚类分析,可以将这些设计意象认知区分开来,但无法有效地区分类目。(3)主成分分析法主成分分析法是一种数理统计过程,通过正交旋转法将一组可能相关变量的观察值转换为一组称为主成分的线性不相关变量的值,主成分的确定是根据相关系数矩阵 R 求的特征根,根据特征根 大于1 的值来确定主成分的个数。主成分分析是基于相关矩阵进行分析,因此将意象词汇词频转换为相关矩阵,并进行主成分分析,得到主成个分数,根据主成分的累计载荷值的大小来说明在众多成分的贡献值,以此确定产品的设计主意象的个数,从而达到
16、对海量意象词汇降维的目的。通过计算各主成分的因子载荷来确定众多样本中的成分因子的具体成分变量,以此更加准确地定位产品主意象,如表 2 所示。表 1 马自达汽车设计意象词词频(部分)表 2 成分矩阵(部分)成分123456789外观0.9520.1870.010-0.004-0.0170.0330.140-0.040-0.053舒适0.8620.437-0.0470.0620.058-0.0140.065-0.081-0.063运动感0.761-0.088-0.2750.4720.165-0.020-0.155-0.014-0.084外形0.6720.359-0.183-0.0460.1170.
17、2440.040.105-0.09紧凑型0.7030.390-0.0710.000-0.161-0.1740.0420.200-0.007魂动红0.7580.290-0.244-0.146-0.108-0.053-0.121-0.1160.162溜背式0.4970.3880.651-0.0180.054-0.0550.0530.046-0.007大气0.768-0.208-0.046-0.385-0.181-0.134-0.1330.080-0.241魂动式0.698-0.4870.046-0.1710.0290.5620.1230.0980.025简洁0.736-0.1520.025-0.0
18、19-0.071-0.0410.132-0.147-0.268亮黑色0.721-0.288-0.0260.179-0.0100.283-0.066-0.0060.277扁平化0.7580.175-0.096-0.212-0.001-0.058-0.055-0.125-0.064材质0.7460.055-0.1380.0950.428-0.064-0.1320.0010.22腰线0.708-0.056-0.137-0.1610.322-0.2710.1000.0040.101流线型0.3640.631-0.294-0.298-0.128-0.3510.175-0.0320.024浅色0.6290
19、.2700.155-0.1710.2300.067-0.125-0.2510.269层次感0.573-0.2410.309-0.044-0.1600.2700.0870.2760.211金属感0.492-0.3690.171-0.005-0.2010.1540.4960.103-0.089序号关键词词频/次1外观32382马自达23063设计16454舒适8575运动感7676紧凑型5387魂动红474.724优雅19725轻便19726金属感18.对各成分进行回归分析,形成成分矩阵,主要的成分根据因子载荷值大小来解释。九个成分分别为“外观”“流线型”“溜背式”“运动感”“材质”“魂动式”“金
20、属感”“层次感”以及“亮黑色”。这些形容词在产品设计中是对设计要素进行意象描述,例如“外观”“流线型”以及“溜背式”是对产品外观的意象描述;“材质”和“金属感”是对产品的材质进行意象描述;“亮黑色”是对产品的色彩进行描述;“运动感”“魂动式”以及“层次感”是对产品的风格特征进行意象描述,从众多杂乱无章的语料文本通过主成分分析法降维形成 9 个维度的马自达汽车设计意象。3.确定语义层级关系通过对语义信息的清洗以及聚类降维处理,信息数据更加具有代表性特征,但语义信息还是比较混乱,没有一定的逻辑关系,不能很好地表达语义之间的联系,因此需要探讨设计语义之间的层级关系。王鹏等:基于大数据的产品设计意象语
21、义挖掘研究综述2023年8月 第36卷 第16期理论研究086设计DESIGN在对语义处理时,可根据语义之间的相似度以及类目的一致性对其进行层级关系的确定,主要采用的是系统聚类法以及决策树模型。(1)决策树决策树基本原理是从基本语义的底层开始,通过实例的方法测试语义的特征,按照一个子结点对应一个特征子语义的原则,将语义分配给对应的子节点。继而执行递归在语义级别上测试分配,直到它到达其叶节点,就可以将语义之间的层次关系得到确定。但由图 2 马自达设计意象的谱系图图 3 汽车色彩意象语义网模型表 3 马自达设计意象类目一级类目 二级类目三级类目马自达汽车设计意象造型多边形 饰条 格栅 圆润 修长
22、曲线 大气 轻盈 流线型 层次感 狭长 纵向 腰线 流畅材质钣金 皮质 塑料 金属感 真皮 油漆 碳纤维 镀锌钢板 玻璃色彩浅色 亮黑色 熏黑 石英灰 红色 亮银色 魂动红 风格溜背式 扁平化 犀利感 舒适 粗犷的 科技感 简约 精致 平稳 魂动式 运动感 优雅 轻便 时尚 硬派感于产品设计意象词汇的特征之间存在较多的交叉性,决策树模型对连续性的文本字段比较难预测,当类别太多时,错误可能就会增加。对于从网络在线评论获取的量比较大,而且产品设计意象类别较多,决策树不适用于此类的分类。(2)系统聚类法系统聚类分析,又称层次聚类分析,聚类原理是根据变量之间的远近关系将最接近的对象归为一组,从而把变量
23、进行聚类细分,直到所有样本案例或变量都聚集到一个类别中,经过这样的流程,结合合适的样本间距离和类间距离计算公式,能够聚类出合适的类目,用户可根据自身分类需求将目标样本进行类别的划分。系统聚类是基于样本的相异矩阵来进行分析的,将马自达设计意象的相异矩阵导入数据分析工具(SPSS.26)进行系统聚类分析,输出谱系图,根据马自达汽车设计领域的知识的基本内容,可将意象语义聚类成 4 类,分别是“造型”“材质”“色彩”以及“风格”,如图 2 所示,以此可以观察到主意象的类目,从而挖掘出意象之间的层级关系,如表 3 所示。(三)语义可视化表征在处理完语义知识后,对得到的信息进行整合并构建具有互操作性的多源
24、信息模型,该模型包含关键概念及其同义词和基本事实等信息的处理以及它们之间的关系8。因此,通过相关模型将语义相关的知识进行可视化展示,可以在相关联的领域达成共识的基础上,使人与设计系统之间的信息交换更加便捷,目前主要模型结构有语义网模型和本体模型。1.语义网模型语义网是一种采用网络结构表示人类知识的方法,用来表达复杂的概念及其之间的相互关系。其基本结构是一个有向图,在图中节点是表征其代表对象的特征,弧是有方向的,方向用来体现节点间的主次关系,其上的标注则表示被连接的两个节点间的语义关系9,在汽车色彩设计时,不同的色调对汽车风格意象有一定的影响。在色彩特征中,对应的色调与亮度的颜色“象征”着汽车风
25、格意象“稳重的-动感的”,因此在语义网模型中,这些设计意象之间的逻辑关系需人工干预来完成,并需准确将语义关系进行标注,以此形成语义网图谱,如图 3 所示。理论研究087设计DESIGN参考文献1罗仕鉴,田馨,梁存收等.设计产业网构成与创新模式J.装饰,2021(06):64-68.2刁焕.基于用户感性需求的高精密天平设计研究D.天津大学,20123苏建宁,张秦玮,张书涛等.产品造型意象进化设计研究进展J.机械设计,2014,31(12):97-102.4章蓉,陈谊,张梦录,孟可欣.高维数据聚类可视分析方法综述J.图学学报,2020,41(01):44-56.5宋云胜,王杰,梁吉业.基于数据划分
26、的k-近邻分类加速算法机理分析J.中国科学技术大学学报,2018,48(04):331-340.6KONONENKO I,KUKAR M.Machine Learning and Data Mining:Introduction to Principles and AlgorithmsM.Chichester:Harwood Publishing Limited,2007.7周美玉,龚丽娜,刘飞.聚类模型在感性设计中的应用J.机械工程学报,2008,4(07):248-252.8B.Dalvi,E.Minkov,P.P.Talukdar,W.W.Cohen,Automatic gloss fi
27、nding for a knowledge base on using ontological constraints,in:Proceedings of the Eighth ACM International Conference on Web Search and Data Mining ACM,2015:369.9夏幼明,刘海庆,徐天伟.基于语义网络的知识表示的形式转换及推理J,武汉大学学报(信息科学版),2001(4):89-93.10GRUBER TR.A translation approach to portable ontology specificationsJ.Knowl
28、edge acquisition,1993,5(2):199-220.11李征,李斌.一种基于关联规则与K-means的领域本体构建方法J.河南师范大学学报(自然科学版),2020,48(01):24-32.12谭影,张凌浩.大数据赋能下的家电品牌售后服务设计策略研究J.设计,2022,35(2):96-99.13付文娟,吕健,于佳雯等.基于可拓实例推理与用户需求的产品设计方法J.设计,2023,36(1):91-95.图 4 本体模型2.本体模型本体是对领域的知识表示,包含概念(即类)的显式描述、概念的特性、属性或特征、对类和属性的逻辑限制10,其实质是对实例、概念及其关系的明确进行概念化表
29、征。在语义挖掘后,通过使用本体的知识表达模型,将产品设计意象语义以知识图谱的形式表现出来,设计师在后期进行设计时,对意象语义进行知识调用,辅助设计师快速形成设计方案。在产品创新设计过程中,通过检索相关信息能够找到更加符合用户需求的信息11。根据主成分分析和系统聚类的方法得出的类目层级信息,在Protg 本体构建工具中提供了自检推理机制,通过修改推理机制的实体、概念约束关系,可以对构建的本体进行修正,为知识之间的概念属性以及关系推理提供了技术支持。因此在软件中定义马自达汽车设计意象本体,根据产品设计中的“造型”“材质”“色彩”以及“风格”4 个“类”,对“类”的关系属性进行定义。根据聚类后的类目
30、层级关系并对 4 个“类”中的实例进行填充以及实例之间的约束关系的设定,即可输出本体知识图谱,如图 4 所示,从而为不同设计系统之间的知识重用和共享提供了一定的基础。三、意象语义挖掘技术研究展望设计知识的在线挖掘与可视化表征是智能设计中重要的组成模块,该模块的构建将辅助设计师利用网络用户评价获得产品设计本体知识,从而进行创新设计与产品开发。打破设计师的思维局限性,更好地与用户建立良好的产品意象认知互动,使得产品设计更加符合用户的感性意象需求,并快速地从本体知识中获取用户的喜好与关注点。大数据技术在产品设计上已经广泛应用,但在以感性意象为创新主体因素的产品设计上还未探索出有效、实用的数据挖掘方法
31、。意象语义的挖掘获取是产品创新设计的前端,意象语义语料的获取是通过网络评价所形成的大数据,目前该方向的研究还存在以下两个研究难点:(1)面向智能设计的基于工业设计语境的用户在线评论体系还没有广泛构建和应用,在大数据挖掘获取外观设计知识时会得到大量与产品设计相关度不高的意象词汇,对设计知识的表达准确度有很大的影响。建立以设计语境为评价角度语义挖掘机制,将对获取高质量的与高贴合度的文本语料具有十分重要的意义。(2)利用自然语言处理技术对网络语料进行处理时,未能有效建立词性之间的关联规则,无法对词与词之间逻辑关系以及关联度进行描述,在挖掘用户评价时需构建一套可自学习的、可关联的意象词汇挖掘聚类的机制
32、与方法,根据词汇之间的关联度,能够泛化出更多具有此相关性的词汇,以此形成更多维的、可扩展的设计知识表征模型。因此,以机器学习为主的大数据挖掘技术将是本研究的关键点,通过数据挖掘、机器学习、知识图谱构建基于产品感性意象的设计知识挖掘系统,将使设计师能更好地掌握产品设计的本体意象,并实现设计知识共享与重复调用。结论对于设计师而言,产品创新设计并不仅仅对产品进行设计,更需要满足用户的需求,让用户感受到产品意象含义,从而达到“以人为中心”的原则。另外,在智能设计越来越受重视的时代,更要重视优化创新的思维、技术、方法及理念。通过分析相关技术在大数据理论下进行收集数据、分析数据、归纳数据等应用具有一定的研究价值。通过对语义分析处理和语义形式化表征以及语义挖掘方法 3 个方面进行分析和阐述,并得出采用网络爬虫技术获取设计意象主成分分析以及系统聚类的方法确定产品主意象的类目,然后通过本体的形式将产品设计意象进行概念化表征,形成知识图谱这种产品设计意象挖掘的流程能够定位产品设计意象,并指导产品创新设计。最后对意象语义挖掘技术进行了展望,通过大数据将海量信息形成知识表示网络并整合到产业链资源,以数据驱动实现产品设计智能化是设计趋势。基金项目:甘肃省自然科学基金(20JR10RA165)。王鹏等:基于大数据的产品设计意象语义挖掘研究综述