1、 65 一、引言信息技术应用 课程是一门面向成都航空职业技术学院所有专业学生的必修课程。这门课程涉及的院系、专业、班级、学生和教师的数量均较多。为了实现教考分离,同时使得学生的课程成绩公平客观,本课程的考查方式是使用无纸化试卷系统来完成阶段测试和期末考试。本研究提出了一套新的试卷综合管理系统,基本上做到了考试的全过程覆盖,有利于减少人工工作量,能逐步实现试卷处理的自动化和智能化。这套试卷综合管理系统包括试题抽取、试卷导出整理、成绩统计分析三个主要功能。考生输入自己的学号登录该试卷系统,在题库中临时抽取题目,组合生成的全新试卷,使得各个学生的考题均不完全相同。抽取题目的算法涉及如何保证每一位考生
2、都能够分配到难度大致相同的试题。由于参加考试的学生人数较多,这是试题生成所面临的问题和挑战。该试卷系统能够对试卷判分,得出学生的考试成绩。如果教师需要进一步查看学生的试卷来评价分析学生对各个知识点、技能点的学习掌握情况,可以从试卷系统中分班级导出电子版试卷。如果需要对各个班级的平时成绩和考试成绩进行分析,可以采用试卷分析功能对试卷成绩进行统计分析。下面简要介绍试题抽取、试题导出、成绩分析功能。(一)考试系统的题目抽取功能每一名考生在电脑上进行考试时,所面对的试卷中每一道题不会完全相同,这样带来的问题是学生参加考试所取得的成绩可能和题目的难度有关。而基于公平原则,每一份的试卷的难度应该大致相当,
3、即这数千份试卷不会具有统计学意义上的不同的难度。一份试卷由20道选择题、10道判断题、4道操作题构成。选择判断题每道题1分,其中两道操基于Linux环境的试卷综合管理系统设计蒋小惠,周珩,曾小平(成都航空职业技术学院,成都 610100)摘要:本研究提出了一套试卷综合管理系统,该系统具有试题自动抽取、试卷整理及成绩统计分析等功能,基本覆盖了考试的全流程。试题自动抽取功能定义了难度系数并且能随机抽取试题,能让学生获取类似难度的不同试卷。试卷整理功能对试卷根据班级分类导出,提高了试卷分发效率。成绩统计分析功能对考生的期末及平时成绩进行回归分析,确认了二者之间具有相关关系。该系统可以减轻人工工作量,
4、实现试卷处理的自动化和智能化。关键词:试卷系统试题抽取试卷整理回归分析中图分类号:G424文献标识码:B文章编号:1671-4024(2023)01-0065-05The Comprehensive Management System Design of Test Paper Based on Linux EnvironmentJIANG Xiaohui,ZHOU Heng,ZENG Xiaoping(Chengdu Aeronautic Polytechnic,Chengdu 610100,China)AbstractThis research proposes a comprehensiv
5、e management system for test papers,which has three main functions:automaticselection of test questions,test papers sorting and statistical analysis of scores,basically covering the whole process of a test.The auto-matic selection function defines the difficulty coefficient and randomly selects the
6、test questions,so that each student can get differentpapers with similar difficulty.The sorting function can export papers by class,which can improve the efficiency of paper distribution.The statistical analysis function can conduct a linear regression analysis on students final exam scores and lear
7、ning process evaluationscores,confirming that there is a significant linear relationship between them.The system can reduce teachersworkload and realizethe automation and intelligence of test paper processing.Key Wordsexam system,question selection,paper sorting,regression analysis收稿日期:2022-09-26作者简
8、介:蒋小惠(1981),女,四川成都人,硕士,讲师,研究方向为计算机应用。成都航空职业技术学院学报Journal of Chengdu Aeronautic Polytechnic2023 年 3 月第 1 期(总第 134 期)Vol.39 No.1(Serial No.134)2023 66 作题分值均为20分,另外两道操作题分值均为15分,总分为100分。本研究提出了一种基于题目难度系数的题目抽取方法,用于抽取题目并保证试卷难度基本保持一致。具体算法在第二节中进行讨论。(二)电子版试卷导出整理功能考试系统导出的试卷是按考试科目分文件夹存放,如图1所示。每个文件夹内存放了所有学生的试卷,即
9、以每一名学生的学号命名的html文档,例如213876.html。图1 考试系统导出的试卷存放目录学生的考试试卷内容及格式如图2所示。可以看出试卷中有学生姓名和准考证号(即学号),但并没有班级这一字段。每一个考试科目文件夹内,所有院系的学生试卷均混乱地排列在一起。在早期的工作中,只能对照包含学号、班级的excel表,人工整理出各班的试卷,交由各班级的任课教师分析留存。这个流程工作量非常大,很容易产生错误,也会耗费大量的人力。为了减少非必要的人工操作,我们在基于Ubantu 18.01系统上开发了试卷自动按照班级分类整理功能。图2 考试系统导出的试卷界面(三)试卷的分数统计分析功能由于 信息技术
10、应用 这一门课程的总成绩是由学生的平时成绩和期末试卷的成绩的加权平均组成,其具体的算法为总成绩=50%平时成绩+50%期末考试成绩。所以有必要研究学生的平时成绩是否和期末试卷的分数存在相关关系,用来评判平时成绩较好的学生,是否同时也能取得较好的期末考试成绩。从而加强对学生的平时成绩的评价管理工作,也能及时发现平时成绩和试卷成绩差异较大的学生,用于进一步的分析。二、试题抽取、试卷导出整理功能及成绩统计分析算法(一)试卷的自动题目抽取功能算法本功能的开发需要结合 PYTHON 软件来实现学生试卷的随机抽取功能。首先需要定义难度系数,由于题库中的每一道题都有其历史得分率数据,包括了选择判断题目的正确
11、率和主观题的得分率。其中,客观题正确率=(正确回答的次数)/(题目出现的总次数)(式1)主观题的得分率=(回答题目的总得分)/(题目出现次数*题目的分值)(式2)由此可见,正确率和得分率处于(0,1)的区间内。难度系数的定义方式有很多种,文献1中介绍了最常用的一种难度系数:L=1-XW(式3)其中,L为难度系数,X为样本平均得分,W为试卷总分。而L的取值范围为(0,1)的区间内。L的值和试题难度成正比,当试题的平均得分较高时,L值偏低,而当试题的平均得分较低时,L值偏高。传统的难度系数的取值区间为(0,1),对于难题和简单题的区分度不高。本文所提出了一种改进的难度系数。我们可以分别定义主观题及
12、客观题的难度系数,其定义如下:客观题的难度系数=1/客观题正确率=(题目出现的总次数)/(正确回答的次数)(式4)主观题的难度系数=1/主观题得分率=(题目出现次数*题目的分值)/(回答题目的总得分)(式5)由式4和式5可得,客观题的难度系数和主观题的难度系数取值范围为(1,+)。例如:一道题目的正确率为20%,那么该题目的客观难度系数为1/20%=5。一道操作题的得分率为10分/15分,那么其主观难度系数为15/10=1.5。这种改进的难度系数,增加了题目之间的区分度,对于较难的试题,其难度系数会更大,从而突出了难题的重要性。一般根据实际情况,我们可以自行定义得分率及正确率的分类区间:某题目
13、,得分率/正确率70%,该题目被分类为简单题目;某题目,得分率/正确率70%且得分率/正确率基于Linux环境的试卷综合管理系统设计基于Linux环境的试卷综合管理系统设计 67 30%,该题目被分类为中等题目;某题目,得分率/正确率30%,该题目被分类为较难题目;关于得分率/正确率的划分区间,可以灵活掌握,根据具体的情况进行调整。于是,题库中每一道题目,根据以往的正确率,可以被分类为简单题目、中等题目、较难题目三种类别之一。根据这样的划分原则,题库中的每一道题目,都可以添加三列新的属性,得分率、难度系数及难度分类。试卷需要20道选择题,可以暂定需要5道简单题目,10道中等题目,5道较难题目。
14、10道判断题可以暂定为 3道简单题目,5道中等题目,2道较难题目。4道具体操作题目可以暂定为1道简单题目,2道中等题目,1道较难题目。令选择题的难度系数为A1,A2A20,判断题的难度系数为B1,B2B10,主观题的难度系数为C1,C2,C3,C4(C1,C2为 15 分分值的主观题的难度系数,C3,C4对应于20分分值的难度系数),则整份试卷的难度系数可以表示为,难 度 系 数-整 体 difficulty coefficient:dc=0.01 i=120Ai+0.01 i=110Bi+0.15 C1+0.15 C2+0.2 C3+0.2 C4(式6)而从题库中随机抽取题目可以通过生成随机
15、数来实现。假设选择题的题库有1000道简单题,每一份试卷可以先生成在0,1区间内均匀分布的随机数5次,然后对这5个生成的随机数乘以1000(题目数量),再进行就近取整,即可得到抽取的选择题的简单题目的序号。例如,假设生成的随机数为0.3672,0.9524,0.1987,0.5458,0.7239,那么将得到序号为367,952,199,546,724的5道题目。抽取题目需要的随机数由计算机产生,而随机数可以分为伪随机数和真随机数。伪随机数是用确定性的算法计算的来自于0,1均匀分布的随机数序列,并不真正的随机,但具有类似于随机数的统计特征。文献2中指出,伪随机数的生成方法主要有直接法,逆转法,
16、接受拒绝法(ARS)等方法。而要获取真正随机的真随机数,需要使用物理随机量作为发生源的真随机数发生器。这些真随机数都是基于特定的真随机数发生源(如热噪声、电流噪声等)产生,每次获取的真随机数都是不可测的,具有很好的随机性。文献2中提到了几种生成真随机数的方法,如采用单片机、串联RC电路、鼠标移动轨迹、多谐振荡器带动喇叭产生的噪声等随机事件来产生真随机数。但是本文中,一套试卷所需要的随机数数量较少(仅需要34个随机数)。同时,在试卷的数量处于数千的数量级情况下,真随机数和伪随机数的差别非常小,所以本文直接采用 PYTHON 软件的 Ran-dom函数生成的伪随机数用于试题的抽取,就能满足客观需求。同理,按照这个算法,也可以得到选择题的中等题目及较难题目的序号。对判断题及操作题的也通过这种方式进行随机选取,得到题目的相应序号。根据考试的目的,可以预设一个难度系数dc1,并且采用正负5%的宽松区间I,如果随机抽取的题目组合,其难度系数落入这个区间I的均可以被认为符合难度系数要求,可以作为正式的试卷提供给学生。例如,如果选定的难度系数dc1=4,那么I=(3.8,4.2)。凡是抽取的试卷题目组