1、本期推荐本栏目责任编辑:王力Computer Knowledge and Technology电脑知识与技术第18卷第36期(2022年12月)第18卷第36期(2022年12月)E-mail:http:/Tel:+86-551-65690963 65690964ISSN 1009-3044Computer Knowledge and Technology电脑知识与技术Vol.18,No.36,December2022灰色关联度分析法的应用热点和方法改进基于VOSviewer的文献计量分析任秋静,刘露,石燕,黄宗海,钟艳梅,温川飙,罗悦(成都中医药大学智能医学学院,四川 成都 610075)摘
2、要:目的:梳理灰色关联度分析法发展历程,构建灰色关联度分析法研究知识图谱,以期为了解和应用灰色关联分析法提供参考。方法 应用知识图谱绘制软件VOSviewer_1.6.13对在CNKI采集的以“灰色关联度分析法”为主题检索到的文献信息进行可视化,对其应用领域和研究方法进行梳理。结果:共检索到3669条结果,其中纳入标准文献2726篇。通过可视化显示:1)灰色关联度分析法的应用主要在农业和经济,其后扩展到物流、制造、技术、中医药等各个行业;2)针对灰色关联度分析法本身客观性不足和评价精度低的问题,学者们将灰色关联分析法与层次分析法、距离分析法等结合使用以改进和弥补其不足。结论:灰色关联度分析法积
3、累的大量应用经验证实了灰色关联度分析法对于小样本、部分可知的系统分析的适宜性,该方法已经成熟可靠宜推及如中医中药等正值与现代科技相碰撞和融合时期的传统领域。关键词:灰色关联度分析法;VOSviewer 计量分析;应用;研究方法中图分类号:TP311文献标识码:A文章编号:1009-3044(2022)36-0001-04开放科学(资源服务)标识码(OSID):灰色关联分析法是基于行为因子序列的微观或宏观几何接近,以分析和确定因子间的影响程度或因子对主行为的贡献测度而进行的一种分析方法。该方法基于灰色系统,可在不完全的信息中对所要分析研究的各因素在随机的因素序列间找关联性1。灰色系统是我国学者邓
4、聚龙教授 1981 年在上海召开的中-美控制系统学术会议上提出的。邓聚龙教授将灰色系统定义为只掌握或只能获得部分控制信息的系统,相应的部分数学特征性确知、部分元素确知的矩阵为灰色矩阵;部分数学特征已知但具体数值未知的参数为灰色参数2-3。与灰色相对的还有白色与黑色,白色表示信息完全已知与掌握,黑色则表示信息完全未知,对于白色与黑色在此不再赘述。灰色关联度分析在灰色系统理论提出后产生并应用于各个领域,从1982年开始应用至今积累了大量的应用实例,同时灰色关联分析法也在应用过程中逐步改进和发展。对于过去灰色关联度分析法在过去三十多年的应用和成果,本文将利用可视化分析软件VOSviewer从实例应用
5、和分析方法发展改进两方面进行可视化阐述。1 灰色关联度分析分析流程与方法灰色关联分析通过确定参考数据列和若干比较数据列的集合形状相似程度判断其联系的紧密程度,并以此确定关联度。灰色关联分析法的分析流程4分为六步(如图1)。图1 灰色关联分析法分析流程1.1 收集数据灰色关联分析法第一步要根据分析目的确定相关因素并进行数据收集。该方法对数据分布没有特定要求,可以任意分布。需要注意的是在进行灰色关联度计算中需注意值不能为负,以免出现运算中的抵消。当出现负值数据时,将所有数据项与最小负值绝对值相加,后续运算采用相加后的数据。1.2 确定数据列确定参考数据列与比较数据列。参考数据列是根据分析目的确定的
6、一个理想比较标准,各影响因素作为比较数据列。以比较数列作为算法子序列与参考数据列即算法母序列进行比较。1.3 对数据进行无量纲化处理各比较数列由于其值不同,甚至单位的不同,如收稿日期:2022-05-14基金项目:国家自然科学基金:基于动态数据的灰色关联分析法构建中医体质动态变化规律知识图谱(81904324),负责人:罗悦作者简介:任秋静,硕士研究生在读,研究方向:中医信息化;通信作者:罗悦,副教授,硕士,研究方向:中医药智能。1DOI:10.14004/ki.ckt.2022.2250本栏目责任编辑:王力本期推荐Computer Knowledge and Technology电脑知识与技
7、术第18卷第36期(2022年12月)第18卷第36期(2022年12月)体重和身高,导致数据差异过大,因此在进行计算之前要对数据进行无量纲化处理。在灰色关联度分析法中进行无量纲化处理采取均值化法或者初值化法。均值化是将包括参考数据列在内的每项数据列各自相加然后求其平均值,然后再以数据列内各数据除以平均值,得到均值化结果。初值化是将包括参考数据列在内的每项数据列的第一行数据作为1,使用数据列中其他数值除以第一行数据得到初值化结果。均值化和初值化处理的目的都是为了将原本数据之间的差异减小,使数据化为相近的无纲量数据,后续计算都采用无纲量化后的数据进行计算,以处理后的数据进行计算可以有效避免计算结
8、果出现偏颇,同时缩小计算误差。1.4 计算关联系数以公式对比较数据列与参考数据列的关联系数进行计算:i(k)=minimink|x0(k)-xi(k)+maximaxk|x0(k)-xi(k)|x0(k)-xi(k)+maximaxk|x0(k)-xi(k)(1)为分辨系数,01,若 越小,关联系数间差异越大,区分能力越强。通常 取 0.5。1.5 计算关联度关联系数是比较数据列与参考数据列在各个时刻的关联度,由若干个数组成,因此需将各个关联系数集中为一个值,求关联系数平均值以作为比较数据列与参考数据列之间的程度数量表示。计算关联度公式ri:ri=1nk=1ni(k)(2)1.6 关联度排序并
9、得出结论对关联度结果进行大小排序,其值越大则关联度越高。2 研究方法与数据来源2.1 知识图谱与VOSviewer分析软件目前广为人知的知识图谱其全称为科学知识图谱,是显示知识的发展进程与结构关系的一种图形,用可视化技术描述已有知识资源及其载体,绘制、挖掘、分析和显示科学技术知识以及相互之间的联系,在组织内创造知识共享的环境以促进科学技术研究的合作和深入,其以科学知识为计量研究对象5。VOSviewer是由荷兰莱顿大学科研究中心的Nees Janvan Eck 和 Ludo Waltman于2009年开发并免费开放使用的知识图谱分析软件。Vosviewer的开发弥补了当时知图谱分析软件仅能满足
10、低于100条数据的项目分析,对大量数据分析无力的缺陷。相较此前的计量分析软件,VOSviewer通过增加和改进缩放功能、特殊标注等手段使其具有更完备的功能6。VOSviewer运用概率论的思想,采用关联强度算法,对共现数据进行归一化处理具有优势,因此适合对大规模网络进行可视化分析7。本文采集的数据有两千多条,因而选取VOSviewer软件作为分析工具。2.2 数据来源与数据格式转换将中国知网作为来源数据库,以“灰色关联度分析法”为检索词进行检索,检索条件:(主题%=灰色关联度分析法 or 题名%=灰色关联度分析法 or title=xls(灰色关联度分析法)or v_subject=xls(灰
11、色关联度分析法);检索范围:CNKI总库。共计算结果3669条,排除会议、学位论文和不相关文献后共计2753篇期刊文献,人工排除无作者文献和重复文献。结果符合纳入文献为 1987 年 01 月-2021 年 10 月合计 2726篇,其中中文文献2535篇,英文文献191篇。检索日期2021年10月19日。将检索到的结果以Endnote样式导出为txt格式,再在Endnotex9中导入题录。经人工筛选排除重复和无作者文献后导出题录,设置导出样式为VOSviewer支持的RefMan(RIS)保存为txt格式记事本,后修改文件后缀名为“.ris”。本文使用的工具软件为VOSviewer_1.6.
12、13。3 数据分析3.1 发文趋势图2 灰色关联度分析法发文量趋势图灰色关联度分析法的应用论文最早见于邓聚龙于1985年发表的 灰色系统与农业8文中列举了灰色关联分析在汾河输沙量和果树产量实例中的应用。其后歭英与石书琰9于1987年利用灰色关联度分析法对棉花品系进行评价,并且将灰色关联度分析法与模糊评价方法进行比较。二者评价结果完全一致,但是灰色关联度分析方法具有计算更加简便的优点。之后灰色关联度分析法逐渐应用在更多的领域,并且在应用中逐渐改进。发文量趋势图(图2)可以看出灰色关联度分析法相关文献在1987年至2015年一直呈上升趋势,其中2004-2015年上升趋势相对较快;在2015年发文
13、量达到顶峰,年发表论文258篇;2015年之后发文量出现下降趋势。3.2 灰色关联度分析法应用可视化3.2.1 高频次关键词可视化将2726条文献题录导入VOSviewer软件进行分2本期推荐本栏目责任编辑:王力Computer Knowledge and Technology电脑知识与技术第18卷第36期(2022年12月)第18卷第36期(2022年12月)析,以关键词出现频率10筛选聚类得到高频关键词标签图(图3)。从图3可以看出灰色关联分析法主要应用在农艺、经济,主要研究内容是影响因素测定和评价指标测定。图3 高频关键词标签图程叶青等10将灰色关联分析法应用于东北地区单位面积粮食产量的
14、性状特征的动态变化研究,并且通过分析成功得出影响单位面积粮食产量变化的重要因素是农业机械总功率、化肥消耗和有效灌溉面积,而提高单位面积粮食产量的有效途径是建设农田改良基础,开垦中低产田等。潘雄锋11则是将灰色关联度分析应用于城市建设和经济协同发展系统。利用协同学、灰色理论、数值分析的相关理论建立城市建设与经济协同发展系统的数学模型,并以此对大连市的城市建设和经济协同发展关系进行分析,得出提高GDP对城市建设与经济协同发展系统向高级有序状态发展极为重要的结论,为城市建设决策提供了参考。图4 高频关键词密度聚类图导入题录屏蔽针对灰色关联度分析法本身的研究得到和高频关键词密度聚类图(图4)。根据图4
15、可以看出,灰色关联度分析法的应用主要分为三个热度板块:一是以农艺性状和农产品集中分布的农业板块;二是与农业密切关联的综合评价应用;三是以经济增长为核心设计到影响因素和产业调整的经济增长模块。马素英12利用灰色关联度分析法对海洋经济效益进行了测评。通过对海洋经济第一、第二、第三产业占比以及海洋经济与国民经济关系的分析,获得了海洋经济产业结构的构成和变化趋势;同时计算海洋经济GDP在国民GDP中的比重,获悉海洋经济与整体经济之间有的相关性。由上述高频关键词的标签聚类和密度聚类可以得到灰色关联分析法应用的最主要范围是农艺性状和农业产品的评价,其次则是经济增长方面的应用;同时对于农业和经济的产业结构也
16、通过灰色关联分析法进行分析调整。对于灰色关联度分析法的应用内容在于综合评价分析,利用灰色关联分析法的部分已知属性对整体进行评价探索。3.2.2 低频次关键词可视化将2726条文献题录导入VOSviewer软件,以关键词出现频次2聚类分析得到低频关键词标签图(图5)。图中由冷色到暖色调的过渡过程表示时间从远至今的显示,图中字标大小表示关键词出现频次,字标越大则出现频次越高。由图5可以看出出现频次最高的仍旧是农艺性状和综合评价,综合分析其原因是在2010年前累计研究发文多集中在农业和综合评价方面。随着研究方法越来越成熟,越来越多的行业出现了灰色关联度分析法的应用。2010年至2015年出现了医药、房地产市场、消费结构等方面的应用;2015年至2021年期间灰色关联度分析法的应用扩展到制造业、物流业、网络等行业。图5 低频次关键词标签图蔡萍等13对杜仲药材有效成分与环境因子的关系进行了灰色关联度分析。通过对影响杜仲皮和叶中有效成分含量产地差异性的主要环境因子的分析,得出碱解氮、速效钾、有机质、年平均相对湿度、年平均最高气温为排名靠前的影响因素,据此为合理施肥及环境调控来提高杜仲次生代谢产物的