1、收稿日期:2022 09 08基金项目:河南省教育科学规划课题(2021YB0232);河南省高等学校重点科研项目(23A520051)作者简介:孙泽军(1979),男,四川省内江市人,工学博士,平顶山学院信息工程学院副教授,主要从事数据挖掘、复杂网络结构挖掘研究“互联网+”背景下学生网络学习行为分析及预警孙泽军,常新峰,王飞飞,杨开语(平顶山学院 信息工程学院,河南 平顶山 467036)摘要:随着“互联网+”模式的飞速发展和普及,信息技术改变了传统的教学模式,网络学习和智慧教学受到了大众的青睐 笔者针对当前网络学习行为分析存在的不足,基于工程教育认证理念,采用数据挖掘方法、机器学习算法和可
2、视化技术对学生的网络学习行为、课程目标达成度及期末成绩进行多维度分析,并根据学生学习行为对期末成绩进行预测,给出预警 该研究有利于探索蕴含在数据背后的学习规律,为管理者提供决策支持,为教师教学提供支撑数据,为学生提供学业指导和预警关键词:学习行为分析;互联网+;机器学习;数据挖掘;聚类中图分类号:TP391文献标识码:A文章编号:1673 1670(2023)02 0037 100引言目前,信息技术已经融入人们的学习、工作和生活等方方面面,随着数字技术、网络技术、5G、数据处理和分析技术的快速发展,教育技术也得到了大幅的提升,网络与各种新技术的融合促进了教学模式的巨大变革 教育从面对面课堂教学
3、为主的传统教学模式逐渐转变为线上、线下、翻转、混合等多种新型教学模式的融合1 自 2015 年国务院印发国务院关于积极推进“互联网+”行动的指导意见 以来,“互联网+”更进一步地促进了教育技术的革新和深入发展 各个高校、企业、政府都建立了大量的在线学习平台,这些网络教学平台为学生提供了各种优质的学习资源 在各类网课平台、钉钉、QQ、腾讯会议等平台和软件的支撑下,学生既可以通过网络面对面地和老师交流,又可以自行学习大量的网络课程,且这种学习不受时间和空间的限制,学生还可以根据自身需要选择学习内容,随时随地进行学习,这给学生的学习提供了极大的便利 因此,教学主体也由以教师为主转变为以学生为主在“互
4、联网+”背景下教师的教学模式和学生的学习方式都发生了变化,相应的学生的学习行为分析和评价方式也应该发生相应的改变 在传统的教学中,对学生的学习行为分析和评价主要是基于学生课堂表现、作业、实验和期末考核来进行 通过教师对各项数据的人工整理和分析,找出学生知识存在的缺陷,然后制定个性化的指导方案 这种传统的学习行为分析方式主要存在以下问题:1)教师对学生的学习行为分析和评价以自己掌握的学习行为数据和主观意见进行,不同教师由于掌握数据不同,认知不同,评价标准也不一样,导致分析和评价结果有较大偏差;2)对学习行为数据的人工分析停留在浅层次和面上,很难挖掘学生学习行为数据间的深层次关联,导致分析结果不准
5、确;3)各种学习数据的融合处理,给人工分析带来巨大的挑战,人工分析效率低,且操作过程中不可避免出现失误或差错;4)传统的学生学习行为数据较单一、片面,不能体现学生的全部学习行为 因此,传统的学习行为分析方式已经不能满足“互联网+”背景下学生学习行为分析的需求 在“互联网+”教学模式下,学生在学习课程中将会产生大量的过程数据,如学习时间、学习时长、作业提交情况、互动、测试、作业等,这些数据较全面地刻画了学生的学习行为,且这些数据由教学平台记录,可以很方便地采集 对这些数据进行清洗、预处理、挖掘和分析,第 38 卷第 2 期2023 年 4 月平顶山学院学报Journal of Pingdings
6、han UniversityVol 38 No 2Apr 2023可以探索蕴含在数据背后的学习规律,为管理者提供决策支持,为教师教学提供支撑数据,为学生提供学业指导和预警 因此,对“互联网+”背景下学生的网络学习行为进行分析有重要的意义和应用价值近年来,已有学者和相关机构对学生的学习行为进行研究,并提出了一些有效的挖掘和分析方法 赵丽等2 提出了传统课堂教学行为分析存在的问题 “多以人脑分析为主,依赖专家,分析效率低,分析不准确”,并分析了人工智能支持的课堂教学行为分析的困境与路径 朱冰洁等3 介绍了“金字塔”式网络学习平台的构建,并通过数据挖掘技术、频次统计和数据可视化方法分析了学生的学习行
7、为 廖雅琪等4 基于 SPSS 软件对学生的学习行为进行了简单的相关分析、等级相关分析、单因素方差分析等 彭涛等5 为有效地挖掘和分析网络教学平台的日志文件,提出了双路聚类建模方法,对学习者进行聚类 Sun Zhiru 等6 利用追踪数据和自我报告数据来识别学生的课前学习行为概况,并调查所识别的学习概况与随时间变化的成就轨迹和翻转本科数学课程中学生感知的成就目标取向之间的关系 采用多项逻辑回归分析、潜在轮廓分析、多元协方差分析等技术对学习者的学习行为进行了挖掘分析,并针对问题提供了相应的建议 综上,现有文献针对传统学习行为分析的不足,结合统计分析、数据挖掘、机器学习、数据可视化等技术,从不同角
8、度对学生的行为数据进行了深入的探索研究,且取得了一定的效果 然而,目前的挖掘分析还处于起步阶段,大多数研究只是针对学生的学习行为与取得成绩相关性进行分析,但是成绩只是学生学习结果的一个客观表现,并不能全面体现出学生解决实际问题的能力 以学生为中心,产出为导向,持续改进为理念的工程教育认证在各高校广泛推行,其重点是培养学生解决实际工程问题的能力 笔者针对工程教育认证标准进行分析研究,基于工程教育认证标准对学生学习行为进行建模、挖掘和分析1相关知识国内外有很多研究学者对学习行为数据进行了研究分析和预测,也提出了大量的研究方法,例如聚类分析方法、相关性分析方法、K-近邻算法、梯度下降算法、合成少数过
9、采样技术(SMOTE)算法、决策树等数据挖掘和机器学习分析方法 以下简单介绍几种常用的方法,更多的方法可以参考综述文献 7 9 1 1数据挖掘方法1 1 1聚类分析方法聚类指将具有相似特征或性质的个体聚集到一起 聚类分析方法广泛应用于工业、医学、交通、社交、教育等多个行业和领域 常用的聚类分析方法有划分聚类、分层聚类、密度聚类 划分聚类针对样本数据集,先建立一个初始划分,然后使用迭代方法优化划分结果 K-means 聚类算法是一种应用较广且较高效的划分算法,该方法根据给定的聚类个数进行划分,其缺点是对异常样本点较为敏感10 分层聚类也叫层次聚类,该类方法采用分层的树形结构,以自顶向下或自底向上
10、的方式进行聚类,近几年学者们也提出了多个改进的层次聚类算法 11 12 密度聚类主要是根据样本间的密度进行聚类,该方法的优点是可以识别任意形状 DB-SCAN 聚类算法是一种经典的密度聚类算法 13,为了适应大数据处理和并行云计算,近几年也提出了基于该算法的多个改进算法 14 15 1 1 2相关性分析相关性分析主要是指对两类或多类样本之间的关联性进行分析,用来衡量两个样本的相关密切程度 相关性分析使用非常广泛,例如市场上分析产品广告和销售量之间的相关性 生物学上分析生物的行为动作与环境的相关性 医学上分析疾病与患者行为之间的相关性 教育上分析学生在线学习行为与学习效果之间的相关性等16 18
11、 常用的相关性分析方法有图表相关分析方法、协方差及协方差矩阵分析方法、相关系数分析方法、多元回归分析方法、信息熵与互信息分析方法等 相关系数方法通过提取样本数据的特征矩阵,能较准确地反映样本之间的相关性 笔者采用相关系数方法对学生学习行为进行研究1 2机器学习方法1 2 1K-近邻算法K-近邻(K-Nearest Neighbor,KNN)算法是一个有监督学习的分类方法,该方法基于“物以类聚,83平顶山学院学报2023 年人以群分”的思想 在特征空间中,如果一个样本附近的 K 个最近样本的大多数属于某一个类别,则该样本也属于这个类别 KNN 方法简单、易懂,同时也很强大,对于手写数字的识别、鸢
12、尾花这一类问题来说,准确率很高 因此,KNN 方法广泛应用于图像识别、自然语言处理19 其缺点是需要人工给出 K 值,不同的 K 值结果可能会产生很大偏差,因此在分析预测中应选择合适的 K 值;另外该方法计算量较大、效率低,对训练数据的容错性太差 针对具体的应用场景,学者们提出了多类改进的 KNN 方法20 21 1 2 2梯度下降算法常用 的 梯 度 下 降 方 法 有 批 量 梯 度 下 降(BGD)、随机梯度下降(SGD)、小批量梯度下降(MBGD)BGD(Batch Gradient Descent)算法是一个求解相对较为精确,但是计算迭代速度比较慢的方法 BGD 在更新每一参数时都使
13、用所有的样本来进行更新 因此,该方法的优点是可以获得全局最优解,且易于并行实现 SGD(Stochastic GradientDescent)算法针对 BGD 迭代速度慢的问题而提出,它是通过每个样本来迭代更新一次,大大减少了计算量,但该方法不能获得全局最优解,且不易于并行实现 MBGD(Mini-batch Gradient Descent)是前两种方法的折中,算法的训练过程比较快,而且也能保证最终参数训练的准确率22 23 2学生学习行为分析笔者采集了所在学校网络学习平台中的学生行为数据 该平台开设课程数 2 499 门,开课教师数 1 167 人,学生人数(含往届生)56 143 人 笔
14、者选取了该校 20192021 学年不同学院不同专业部分学生的学习行为数据作为研究对象,数据的详细描述如表 1 所示 首先,基于学生行为数据,结合数据分析方法和工程教育认证理念建立学习行为分析模型 其次,基于所构建的模型采用数据挖掘方法和机器学习方法对学生的学习行为数据进行挖掘分析和预测研究 最后,学生、教师和决策者可以根据分析结果进行持续改进,根据预警信息,教师可以及时调整教学方法,学生可以有针对性地调整学习方式方法表 1数据描述序号课程专业班级人数1Python 语言及应用 物联网工程17 物联 1 班612电子电路基础物联网工程20 物联网工程 1、2 班1213数据结构通信工程、电子信
15、息工程19 通信 1 班、19 电子 1 班1224C 语言电气工程及其自动化、应用统计学、数学与应用数学、机械电子工程、城乡规划20 电气一班、19 应统 1 班、19 数学 1 班、19 机械 2 班、19 城规 1 班3125计算机基础播音与主持艺术、汉语言文学、环境设计、商务英语、戏剧影视文学、行政管理、音乐表演19 音表 1 班、19 戏文 1 班、19 商英 1 班、19 环境 2 班、19 行管 1 班、19 汉本 1 班、19 播音 1 班3032 1分析模型网络学习平台中大量的数据为模型分析提供了数据基础,笔者选取与学习行为相关的数据进行研究分析,主要包括课程学习情况(次数、
16、视频观看时长、章节测验)、互动情况(交流、答疑)、作业完成情况、实验完成情况等 与其他分析模型不同的是,本模型不但研究分析学生的学习行为与获得的成绩之间的相关性,而且进一步研究分析学生学习行为与课程目标达成之间的关联性 笔者所构建的学生学习行为分析模型如图 1 所示,该模型包含学生、教师、决策者三个主体,每个主体都形成一个持续改进的闭环 首先,从网络学习平台中采集相关数据;其次,对数据进行预处理,主要是对重复数据、异常数据、空值数据等进行处理;再次,采用数据挖掘分析和机器学习方法对学生的学习行为数据进行分析;最后,针对模型给出的分析和预测结果,学生、教师、决策者进行持续改进 学生可以根据分析和预测结果调整学习的重点,改变学习方法;教师可以根据分析结果调整教学策略,有针对性地实施个性化教学,对预警的学生给予重点关注;决策者可以根据分析结果从宏观层面上考虑平台教学资源配置和过程管理的合理性,以及培养方案的调整93第 2 期孙泽军,常新峰,王飞飞,等:“互联网+”背景下学生网络学习行为分析及预警图 1学习行为分析模型2 2学习行为聚类分析聚类方法可以把具有相似特征的数据归类到一起,聚类分析可