1、基于主成分、聚类分析对我国各地区居民幸福指数的研究潘秋艳 葛梅梅 魏薇摘 要:随着社会经济的持续开展,人民的生活质量不断提高。居民幸福指数反映了人民群众的生活质量以及对生活的主观感受。因此,分析我国各个地区居民幸福指数的相关指标及影响因素,是关注各地区人民生活质量水平,提升当地居民幸福感的一个好方法。通过主成分分析和聚类分析的方法,利用R语言和SPSS软件对我国2023年31个省市的幸福指数的指标进行分析,进而对提高各地区居民的幸福指数提出有效的建议。关键词:幸福指数;聚类分析;主成分分析;建议中图分类号:C916 文献标志码:A 文章编号:1673-291X202321-0028-04一、幸
2、福指数的含义幸福指数是人们幸福感的度量值,它是反映民众主观生活质量的核心指标。近几年,随着生活水平的提高,大家对“幸福的重视程度也越来越高。笔者根据黎昕等中提出的幸福指数指标,从中选取客观性指标,再从统计年鉴中下载2023年的数据进行分析,利用主成分分析和聚类分析的方法对我国各地区居民幸福指数进行研究。本文结合许多学者关于幸福指数的观点,将幸福指数体系划分为三局部:生活质量与幸福、社会环境与幸福和自然环境与幸福。二、指标的选取及数据来源根据幸福体系的构建,本文选取了我国31个省、市、自治区及直辖市的12个指标进行建模,数据来源于中国统计年鉴和国家统计局。选取影响国民幸福的指标有:GDP城镇居民
3、人均可支配收入、城镇居民人均消费支出年末城镇人口比重、建成区绿化覆盖率、森林覆盖率、播送节目综合人口覆盖率、生活垃圾无害化处理率、出生率、文盲率、死亡率、失业率,共12个指标,其中前10个为正指标,失业率和文盲率为逆指标。三、各个地区居民幸福指数的主成分分析主成分分析是研究如何将多个变量转化为少数几个综合变量主成分的一种统计降维技术。这种技术使得转化出来的综合变量能够代表原始变量的绝大多数信息且综合变量之间互不相关。根据2023年中国统计年鉴,将全国31个省直辖市所要研究的指标汇总成表,利用R语言软件对数据进行主成分分析,输出结果是前5个主成分累计方差奉献率到达85%,说明选取5个主成分可以解
4、释原始变量的大局部信息。得到主成分的模型为:F1=0.124X1+0.951X2+0.905X3+0.825X4+0.100X5+0.385X6-0.006X7+0.215X8-0.145X9-0.477X10-0.285X11-0.147X12F2=0.783X1+0.047X2+0.238X3+0.421X4+0.511X5+0.733X6-0.059X7+0.320X8+0.064X9-0.199X10-0.437X11-0.066X12F3=0.285X1+0.017X2+0.148X3-0.230X4+0.243X5-0.202X6+0.109X7+0.799X8+0.166X9+0
5、.702X10+0.444X11-0.302X12F4=0.042X1-0.221X2-0.208X3+0.062X4-0.276X5-0.019X6+0.047X7+0.104X8+0.879X9-0.284X10-0.272X11+0.680X12F5=0.093X1+0.008X2+0.048X3+0.135X4+0.587X5-0.073X6+0.921X7+0.160X8+0.176X9+0.102X10-0.491X11-0.190X12由上述主成分模型可得:第一主成分为城镇居民人均消费支出、城镇居民人均可支配收入、年末城镇人口比重,第二主成分为GDP播送节目综合人口覆盖率,第三主
6、成分为生活垃圾无害化处理率、出生率,第四主成分为死亡率、失业率,第五主成分为建成绿化覆盖率、森林覆盖率。文盲率对主成分的载荷较小,说明文盲率对居民幸福指数的影响没有直接的关系,可能还受其他因素的共同影响。第一主成分主要代表城镇居民的收支情况,第二主成分代表居民生活消费水平,第三主成分反映的是生活条件水平,第四主成分是逆指标,即降低居民幸福感的因素,第五主成分代表当地的绿化水平。再用R语言软件进行分析得出各主成分得分及其综合得分表,并按第一主成分从小到大的顺序进行排序见下页表。结合主成分得分即综合得分表可知,综合得分较高的城市有北京、上海、浙江、广东、江苏,这些城市的第一主成分值较高,说明这些城
7、市居民的收支情况和消费水平均较高且开展较快,居民在这些地方许多生活条件及物质所需都能得到大幅度的满足,所以当地居民幸福指数偏高;但这些地区的第五主成分值即当地的绿化水平偏低,可能是因为在这些地区城市建设兴旺且人口较多,没有较高的绿化和森林区域,综合考虑对当地居民的幸福指数影响不大。还有许多地区综合得分值相对居中,这些地区可能受地区的地理环境和经济开展的共同影响,两个因素相互制约,所以当地居民的幸福指数相对居中。然而青海、海南、西藏、这些风景优美的旅游胜地的主成分综合得分较低,可能与这些省市的家庭因素和人口密集度有关,这些地区的第五主成分即绿化水平较高,与这些地区是旅游景点有关。但正是由于当地旅
8、游人口较多且人口种族混杂,影响当地居民的幸福感。四、各个地区居民幸福指数的聚类分析聚类分析是将样品或变量进行分类的多元统计分析方法。其功能是建立一种分类方法,将一批样品或变量,按照它们在性质上的亲疏、相似程度进行分类。按照分组的方法论不同可分为系统聚类法和k均值聚类,按照分析對象不同可分为R型聚类和Q型聚类。常用的方法有最长距离法、最短距离法、中间距离法、离差平方和法。上述主成分分析已经确定5个主成分,在SPSS中利用因子分析画出碎石图见图1。碎石图在成分数为5时是拐点,可验证在聚类时聚成5类较为适宜。然后用聚类分析将这31个省市的数据分为5类,本文利用R语言且采用离差平方和法进行聚类,结果如
9、下页图2所示。结合图2离差平方和法聚类可将31个省市分为5类。第一类:北京、上海、浙江;第二类:天津、山西、内蒙古、吉林、黑龙江、江西、广西、新疆、甘肃、陕西、云南、贵州、重庆、河北、辽宁、安徽;第三类:四川、福建、河南、湖北、湖南;第四类:广东、江苏、山东;第五类,西藏、海南、青海、宁夏。结合主成分得分即综合得分表可知,第一类地区居民的幸福指数最高,可能因为这些城市经济比拟兴旺,第四类地区居民幸福感在其次,这些地区大多是沿海城市,温度及环境适宜使当地居民幸福指数增加,第二类地区居民幸福指数居中,这些地区地理位置比拟靠北且各个主成分值也居中,第三类较低,第五类最低。由此说明,我国各省市之间幸福
10、指数存在着一定的差距。五、各个地区居民幸福指数提升的建议1.提上下收入人群收入,提高居民幸福指数。俗话说:“民以食为天。有些低收入人群可能连根本的生活必需品都负担不起,提高这局部人的收入是提升居民幸福指数的有效方法。他们的收入提高了才能使衣食住行有保障,使居民的物质需求得到满足,他们才会讲究精神层面的幸福指数,从而使社会整体的幸福指数提高。可以从增加社会福利和增加岗位两方面出发,政府部门要落实社会福利政策,尽可能地为他们提供岗位,让他们靠自己的双手去创造财富。这样才能是真正的幸福:有事做、有希望。2.加强根底设施建设,改善民生。如今,经济全球化正在缩小着世界各国之间的时空距离,但是人们之间的实
11、际距离即居民幸福指数却在不断地拉大。有些兴旺城市居民幸福指数越来越高,但有些城市居民幸福指数却在下滑或是停滞不前,假设想提高总体的居民幸福指数,就必须加强不兴旺地区和开展中地区的根底设施建设,可以从铁路建设、环境设施、公园建设、绿化建设这几个方面着手。铁路建设可以方便居民的出行以及增加旅游的时机,从而提高幸福指数;增加环境设施可以改善空气质量,从而提高居民的舒适度和健康状况;公园设施和绿化设施可以使他们的生活更加惬意,进而提升居民的幸福指数。3.加强食品平安管理,确保“舌尖上平安。如今,人们生活条件越来越好,更多人不满足于平常的食物而去追求更多新奇美味的食物。但是他们很少注意食品平安,例如现在
12、出现的疫情正是很好的反例,一个人追求野味,全国人在家陪他承受后果,全国停留在宅在家、不营业、不上班的状态,将全国人民的幸福指数大幅度拉低。所以在此呼吁大家一定要注意食品平安,一不留心可能会给他人甚至全国带来威胁。食品平安是提高幸福指数的保障,有关部门需要提高食品平安的标准,进一步完善相关法律法规,并努力提升公民文化素养,从而提高当地居民的幸福指数。参考文献:1 黎昕,赖扬恩,谭敏.国民幸福指标体系的构建J.东南学术,2023,5:66-75.2 赵一纯.基于因子分析、聚类分析对我国居民幸福指数的研究论国民幸福指数J.中国商论,2023,27:149-152.3 魏芸菲,凌济民,陈烛蔷,王学军.基于主成分、聚类分析对我国各个地区幸福指数的研究J.安庆师范学院学报:自然科学版,2023,4:40-44.4 徐锦,李芳.基于主成分分析和聚类分析的国民生活幸福指数综合评价J.中国林业经济,2023,4:84-88.5 周绍杰,王洪川,苏杨.中国人如何能有更高水平的幸福指数基于中国民生指数调查J.管理世界,2023,6:8-21.6 何曉群.多元统计分析M.北京:中国人民大学出版社,2023.7 国家统计局.2023中国统计年鉴K.北京:中国统计出版社,2023.