1、体育科技2022 年(第 43 卷)第 6 期33基于聚类分析和 BP 人工神经网络的中学生体质健康综合评价模型研究基于聚类分析和 BP 人工神经网络的中学生体质健康综合评价模型研究赵喜迎1江 宇2刘 鹏1(1.南京晓庄学院,江苏 南京 211171;2.南京市中小学生体质健康促进研究中心,江苏 南京 211171)1010A Comprehensive Evaluation Model of Secondary School Students Physical HealthBased on Cluster Analysis and Back Propagation(BP)Artificial
2、 Neural NetworkZHAO Xiying,etal.(Nanjing Xiaozhuang University,Nanjing 211171,Jiangsu,China)摘要:摘要:文章探讨中学生体质健康综合评价模型的构建,为中学生个性化体育锻炼方案或运动处方的制定提供决策依据。采用分层整群抽样的方法,选取 2018-2019 年南京市 12 个区抽测的高一年级 1003 名学生体质健康监测数据。在运用聚类分析确定中学生体质健康类别的基础上,采用 BP 人工神经网络构建中学生体质健康综合评价模型。通过聚类分析得出学生体质健康的 4 个类别,对每类别的学生体质健康特点进行分析,发现
3、第类的特点为身体形态差、身体机能指标差、身体素质中,第类的特点为身体形态良、身体机能优、身体素质良,第类的特点为身体形态优、身体机能良、身体素质差,第类的特点为身体形态中、身体机能中、身体素质优;第类在 BP 人工神经网络模型中的预测准确率最高,其结果为 99.1%;其次是第类,预测准确率为 92.9%;第类预测准确率为 92.1%;第类预测准确率为 90.4%。基于聚类分析和 BP 人工神经网络构建中学生体质健康综合评价模型具有较高的准确性,可用于中学生体质健康的综合评价。关键词:关键词:体质健康评价;聚类分析;BP 神经网络基金项目:教育部人文社会科学研究青年基金项目(19YJC89006
4、2)。作者简介:赵喜迎(1984),博士,副教授,研究方向:体育教学与青少年体质健康干预。通信作者:江宇(1965),教授,研究方向:体育心理与儿童青少年体质健康。学生体质健康一直是社会、学校、家庭等各方共同关注的话题。为建立健全国学生体质健康监测评价机制,鼓励学生积极参与体育锻炼,教育部印发 国家学生体质健康标准(2014 年修订)(以下简称“标准”)。近年来,为进一步提高学生的体质健康水平,政府以及各级教育部门相继出台政策措施,加快推进学校体育改革,学校体育工作取得了较大进展。但总体上看,体育在整个教育事业中仍然处于相对薄弱的地位,学生的体质健康状况依然是社会、学校和家庭共同的担忧。学生体
5、质健康的促进离不开对学生体质健康的评价,评价是促进的前提。在中国知网、维普期刊网、超星期刊数据库查阅、分析相关文献发现,有关学生体质健康评价方面的研究多围绕以下两个方面展开:以“标准”为参照,对某一地区学校学生体质健康状况进行单项评价或综合评价的研究1-3。为丰富和完善国家学生体质健康评价的思路和方法,一些学者从综合评价的角度进行了探索与尝试。有学者采用因子分析法4、秩和比与密切值法5、可拓学6、雷达图7等构建了大学生体质健康综合评价模型;还有学者运用聚类分析和 Fisher 判别分析方法构建了大学生的体质综合评价分级模型8-10;也有学者运用 BP 人工神经网络模型构建了大学生和成年人体质综
6、合测评模型11-14。综上所述,现行以“标准”为参照对学生体质健康评价的研究,单项指标评价的多,综合评价的少。由于体质健康是由多因素构成的,单一指标评价往往获得的是学生体质健康状况的“局部信息”,在以“局部信息”为参考做出体质健康促进决策时,可能会导致“头痛医头、脚痛医脚”问题。以“标准”为参照进行单项或综合评价,常忽略不同地区的经济、文化、教育等外部环境对学生体质健康的影响15。在学生体质健康综合评价视角的研究中,部分运用解决线性问题的方法来构建学生体质健康综合分类评价模型8-10,较少运用解决复杂非线性问题的机器学习算法来构建学生体质健康综合评价模型。已有的运用解决复杂非线性问题的综合评价
7、11-14研究,在建模的样本对象、样本数量以及指标的选取上皆存在着不同程度的差别。此外,由于学生体质健康综合评价往往是非常复杂的,各个指标之间互相影响,呈现出复杂的非线性关系。人工神经网络和支持向量机作为一种智能化的数据处理方法,其具有非线性关系数据的能力,与其他综合评价方法相比具有较好的优越性。鉴于此,本研究以南京市 1003 名高一男生的体质健康数据作为建模样本,采用身体形态、身体机能和身体素质三大类共 9 项指标,来反映学生的体质健康状况。在聚类分析的基础上,运用 BP 人工神经网络构建学生体质健康综合评价模型,并验证模型的精确性。1 研究对象与方法1 研究对象与方法1.1 研究对象本研
8、究以中学生体质健康综合评价模型为研究对象。于 2018-2019 年采用分层整群抽样的方法,在南京市 12 个区(每年每区抽取 1 所高中,每个年级抽取 45 名学生)抽测的 24 所市级监测点校高一男生体质健康指标数据作为测试数据建模。建模指标包括身体形态指标(身高、体重)、身体机能指标(肺活量、握力)、身体素质指标(50m 跑、立定跳远、坐位体前屈、1000m 跑、引体向上)共三大类 9项指标。对数据进行筛选、处理后,有 1003 名学生的数据符合研究要求。该研究经南京市中小学生体质健康促进研究中心批准,监测数据来源准确可靠,所有监测对象均知情了解,签署知情同意书,积极配合完成市级点校体质
9、健康监测。1.2 方法1.2.1 聚类分析法聚类分析法,是根据研究对象的特征对研究对象进行分类的多元分析技术的总称12。通常采用 K-均值聚类法和层次聚类法。本研究采用 K-均值聚类法对学生的体质健康数据进行聚类。K-均值聚类法可用于大量数据进行聚类分析的SPORT SCIENCE AND TECHNOLOGY Vol.43,NO.6.2022DOI:10.14038/ki.tykj.2022.06.031体育科技2022 年(第 43 卷)第 6 期34情形。通过聚类分析将研究目的和数据特征相结合,合理地把数据分成若干个类别,使类别内部差异尽可能小,类别间的差异尽可能大。(1)首先确定需要的
10、类别数量。在实际分析过程中,需要根据研究问题,反复尝试将数据分成不同的类别数,并进行比较,从而找出最优方案。(2)根据数据本身结构的中心,或者随机选择 N 个案例来初步确定每个类别的原始中心点。(3)逐一计算各案例到各个类别中心点的距离,将各案例按距离最近的原则归入各个类别,并计算各类别的新中心点(用平均数表示)。(4)按照新的中心位置,重新计算各案例距离新的类别中心点的距离,并重新进行归类,更新类别中心点。(5)重复步骤(4),直到达到一定的收敛标准,或者达到事先指定的迭代次数为止。1.2.2 BP 人工神经网络方法BP人工神经网络是一种有导师监督学习的多层前馈神经网络,该网络的特点是信号前
11、向传递,误差反向传播。在前向传递中,输入信号从输入层经隐含层逐层处理,直至输出层。每一层的神经元状态只影响下一层神经元状态。如果输出层得不到期望输出,则转入反向传播。根据预测误差调整网络的权值和阈值,从而使 BP 神经网络预测输出不断逼近期望输出。BP 神经网络的拓扑结构如图 1 所示。图 1 BP 神经网络拓扑结构图图 1 中,?1,?,?,是 BP 神经网络的输入值,类,类,?类是 BP 神经网络的预测值,?和?P是 BP 神经网络的权值。从图 1 中可以看出,BP 神经网络可以看成一个非线性函数,函数输入值和预测值分别为该函数的自变量和因变量。当输入节点数为?、输出节点数为?时,BP 神
12、经网络就表达了从?个自变量到?个因变量的函数映射关系。2 结果2 结果2.1 K-均值聚类法的学生体质健康类别划分运用统计学软件 SPSS 26.0 对 1003 名高一男生的体质健康数据进行聚类分析。在进行聚类分析之前,首先将各项体质健康指标数据进行标准化,对于高优型指标(数据越大,代表成绩越好)直接将数据进行 Z 标准化,对于低优型指标(数据越小,代表成绩越好,如 50m 跑、1000m 跑计时类项目)进行 Z 标准化后,在数值前面加负号。聚类数目借鉴“标准”中的优秀、良好、及格和不及格的表述,设置为 4 类。在本研究中以类、类、类、类来表示。根据聚类的结果详细分析每一类别学生体质健康的特
13、点,根据评价标准制定的相关习惯用“优”“良”“中”“差”来描述,南京市高一男生体质健康状况的聚类分析方差结果及最终聚类中心情况见表 1、表 2。表 1 高一男生体质健康聚类分析方差摘要情况体质指标聚类误差?均方?均方?身高87.92430.739999118.9820体重145.19630.567999256.0860肺活量137.82030.589999233.940050m 跑109.91830.673999163.3460立定跳远138.16930.588999234.9480坐位体前屈26.44130.92499928.6280握力95.29530.717999132.93901000
14、m 跑127.12330.621999204.6240引体向上170.15530.492999345.8250表 1 是学生体质健康聚类分析的方差分析结果,实际上就是按照类别分组后对所有指标依次进行的单因素方差分析。从中可以看出,哪些指标在各个类别间的差异具有统计学意义,并根据F值的大小近似得到哪项指标在聚类分析中的作用更大的结论。由表 1 可知,在对 1003 名高一男生的体质健康数据聚类分析中,各项体质健康指标在各类之间均具有统计学显著性,各项体质健康指标对聚类结果的重要性程度排序为:引体向上体重立定跳远肺活量1000m 跑50m 跑握力身高坐位体前屈。表 2 高一男生体质健康聚类情况体质
15、指标类(295 人)类(302 人)类(178 人)类(228 人)身高0.526490.721440.064720.32491体重0.654710.522710.926730.56875肺活量0.765640.859300.132850.2512750m 跑0.069420.267521.117790.60812立定跳远0.347760.303731.025080.84793坐位体前屈0.349760.090980.103340.41271握力0.733810.605480.123840.244131000m 跑0.006060.212101.223590.66648引体向上0.316140
16、.286570.647091.29379表 2 与表 3 显示的是各个类别中的学生人数和每一类学生体质健康的特点。由表 2 可知,显示在学生人数最多的SPORT SCIENCE AND TECHNOLOGY Vol.43,NO.6.2022体育科技2022 年(第 43 卷)第 6 期35是第类,其次是第类、第类和第类。由表 2、表 3可以看出,每一类学生的体质特点,第类学生体质健康表现为身体形态指标差(身高指标中、体重指标差)、身体机能指标差(肺活量、握力指标均差)、身体素质指标中(各项指标皆为中)的特点;第类学生体质表现为身体形态指标良(身高指标优、体重指标良)、身体机能指标优(肺活量、握力指标均优)、身体素质指标良(各项指标为良)的特点;第类学生体质表现为身体形态指标优(身高指标良、体重指标优)、身体机能指标良(肺活量指良、握力指标中)、身体素质指标差(各项指标差)的特点;第类学生体质表现为身体形态指标中(身高指标中、体重指标中)、身体机能指标中(肺活量指标中、握力指标良)、身体素质指标优(各项指标皆优)的特点。表 3 不同类别高一男生体质健康的特点类别身体形态身体机能身体素质类