1、人工智能赋能教育评价改革:发展态势、风险检视与消解对策 鹿星南高雪薇鹿星南/湖北师范大学教育科学学院校聘副教授,博士,硕士生导师(湖北黄石435002);高雪薇/湖北师范大学教育科学学院硕士研究生(湖北黄石435002)。中国教育学刊2023.02官方微信号:zgjyxk教育评价作为对教育活动现实的或可能的价值作出科学判定的过程,是教育改革和发展的“指挥棒”和“方向盘”,事关教育事业的高质量发展。起源于现代工业文明的教育评价与技术有着天然的联系,“往往新技术一经出现,很快就有相关研究探索其在教育评价中的运用”。1近年来,因应人工智能与教育的双向赋能,催生了诸如无纸化考试、智能书写测评、智能命题
2、等教育评价领域的新生事物。2020 年 10 月,中共中央、国务院印发的深化新时代教育评价改革总体方案(以下简称总体方案)明确指出要借助人工智能、大数据等现代信息技术来创新评价工具,不断提高教育评价的科学性、专业性、客观性。教育评价与人工智能的深度融合,正成为新时代教育评价改革的主旋律。然而,现行教育评价体系的不科学、不完善难以适应人工智能快速应用与教育事业高质量发展的内在需求。基于此,本文从梳理人工智能赋能教育评价改革的发展态势着手,检视与探寻人工智能赋能教育评价改革面临的现实风险及消解对策,以期对新时代教育评价改革的健康有序推进有所裨益。一、图景扫描:人工智能赋能教育评价改革的发展态势(一
3、)评价理念革新:由甄别选拔转向因材施教发端于工业文明的现代教育评价深受整齐划一的教育工厂思想钳制,使教育评价逐渐偏离其本体价值,在实践中衍生出注重标准化、统一化或经验化等异化现象。究其原因,工业社会所标榜的工具理性和技术理性赢得了现代教育评价的主导地位,加速了现代教育评价的“虚假繁荣”,评价主体对“分数、升学、文凭、论文、帽子”等短期利益趋之若鹜,评价目的和过程倾向于甄别与选拔,最终导致人文精神和生命价值的旁落与沦丧,人的个性生命成长也被悬置起来。总体方案锚定加快推进教育现代化、建设教育强国、办好人民满意的教育等根本旨归,以破“五唯”来扭转不科学的教育评价导向,充分彰显了以人为本、因材施教的教
4、育评价理念。同时,智能技术赋能有利于因材施教理念的落地。因此,人工智能与教育的相互赋能以及新时代对摘要教育评价作为对教育活动现实的或可能的价值作出科学判定的过程,是教育改革的“指挥棒”和“方向盘”,事关教育事业的高质量发展。人工智能已然成为助推新时代教育评价改革的“利器”,有效地革新评价理念、丰富评价主体、转换评价方法、改善评价结果。人工智能的双刃剑效应也引发了多重教育评价风险,表现为评价制度和数据标准的缺位、技术至上的作祟、评价主体智能素养的孱弱、数据主义的滥觞、隐私安全的披露等。规避人工智能赋能教育评价改革的风险,应加强制度供给,规范教育评价行为;遵循教育评价的育人逻辑,促成价值理性与工具
5、理性的耦合;增强主体智能素养,培养专业化教育评价人才;数据主义祛魅,提升教育评价效能;编制数据伦理规约,构建至善的教育评价范式。关键词人工智能;教育评价改革;发展态势;风险检视;消解对策中图分类号G521文献标识码A文章编号1002-4808(2023)02-0048-07热点问题研究-48创新型人才的深切期许,功利主义驱使下的教育评价模式难以为继,推动评价理念从关注“甄别选拔”走向基于“因材施教”,把人的发展置于教育评价改革的核心地位。具言之,依托物联网、大数据、学习分析、机器学习等智能技术,实时感知、捕捉、融合与精准分析多模态教育大数据,能够实现对个体综合素质水平的数字画像建构、精准诊断与
6、评估,提供个性化的可视化诊断报告,给予不同评价对象个性化的教育干预服务。以学习者自我导向学习评价为例,借助智能技术融合多种学习形式,按照“识材施教发展”的演进逻辑,为学习者创造“因材择学”的机会。2(二)评价主体位移:由单级转向多级尽管我国已从政策层面呼吁与承认来自政府、学校、家庭、社会等领域多主体参与教育评价的重要价值,但不同主体参与程度不平衡、不充分,缺乏双向或多向的协商对话。因为政府部门作为教育评价的权威主体,凭借“裁判员和运动员”的双重身份“发起”并“参加”评价活动,往往表现出行政权力的越位、缺位甚至错位等乱象。同时,囿于声望利益、人情关系的规约,其他利益主体经常以旁观者角色“置 身
7、事 外”,缺 失 应 然 的 话 语 权 和 利 益 表达权。人工智能技术将推动教育评价从“主体结构单一、范式封闭独白”3的蛰伏中走向多主体有效互动的觉醒。其一,具备多模态融合、开放共享、高速流转等特征的教育大数据有望突破传统“命令-控制”的教育评价范式,激活其他主体对评价信息的知情权、监督权,不断优化评价主体结构。其二,教育大数据建构的多维评价空间能够拓展评价数据来源,推动学生、家长以及社会等不同层面的利益主体实时获取所需数据,并依托智能共享平台表达各自的诉求、立场或建议,以此弥合不同评价主体间的利益分歧。此外,人工智能系统或智能机器等具有主体性的智能体也能够以一定身份参与教育评价。其三,人
8、工智能技术在聚合多元评价主体的同时,通过厘定多元主体间的角色权利、探索不同主体交流互动的对话模式,推动他们由既往“评与被评”的主客体关系转向“共同参与、协商对话、形成共识”的主体间性关系。概言之,人工智能技术正加速赋能“各美其美、美美与共”的多级主体共治的教育评价格局。(三)评价方法转换:由经验主导转向数据驱动既往教育评价掣肘于数据采集技术和分析方法的落后,评价方法主要是基于假设的“小数据”评价方法,其要么局限于评价主体的主观推断,要么依托理论假设的小规模抽样统计,或者囿于抽象的评价指标,导致评价结论的生成多侧重于“路径依赖和对研究者主观观念的个性依赖”4。故此,以纸笔测验、抽样问卷、课堂观察
9、为主的传统教育评价方法难以抵御经验主义的诱惑,往往以忽视教育的复杂性、非线性为代价而换取评价结果的全面性和客观性。教育数据在教育评价各个环节的持续累积、动态生成与无缝流转,促使教育评价方法从“始于假设”的小数据评价走向“数据驱动”的大数据评价。数据驱动的教育评价方法是借助新型信息技术不断赋能传统教育评价工具和方式,打造“全样本数据+复杂模型+归纳分析+可视化反馈”的评价方法体系。5一是在评价数据采集阶段,利用物联网感知、视频监控、在线学习平台等智能工具实现多模态教育教学数据的动态抓取,再现真实、自然的教育样态,不断提升评价依据的客观性。二是在评价数据分析阶段,综合运用教育数据挖掘和学习分析等算
10、法技术,对多模态教育数据进行清洗、加工和转换,并通过建立可解释的评价模型,探求数据背后隐含的教育价值和规律,促成教育评价的价值判断走向精准。三是在评价数据反馈阶段,利用大数据可视化技术,将评价数据分析结果以直观、具象的方式表达为可感知的图表或图形,真实刻画评价对象的成长轨迹,持续增强评价反馈的有效性。(四)评价结果改善:由片面僵化转向全景式测评受“学而优则仕”等传统文化、科学实证主义思潮的支配,当前教育评价结果的表征、反馈、解释、使用等亟待完善。即传统评价结果的表征多源于纸笔测验背后的成绩和排名,极易诱发量化数据的片面僵化使用,难以反映评价对象的客观实质;传统评价结果的反馈常拘泥于数据类型单一
11、、次量不足等因素,削减了评价结果的科学性;传统评价结果的解释往往停留在小样本数据的描述分析或是经验判断,难以抵达评价对象的内在发展水平;传统评价结果的使用经常与利益人工智能赋能教育评价改革:发展态势、风险检视与消解对策-49名利捆绑,沦为评价对象凸显政绩、赢得政策支持、获取资源的工具。人工智能驱动下的教育评价将助推评价结果范围拓展至“一切的教育和教育的一切”。6首先,在评价结果表征和解释方面,借助可视化技术,以图形、图像等形式表征评价结果,更直观地反映评价对象的优势与不足,使评价结果的解释更加通俗易懂。其次,在评价结果反馈方面,依据智能推送技术,为评价对象提供动态、个性、精准的评价结果反馈,协
12、助师生持续改进教育教学活动。例如,在课前预习测评和课堂实时检测中,通过高度个性化定制技术既能精准反馈评价结果即时调整学习策略,又能根据评价结果精准推送教学和学习资源。7最后,在评价结果使用方面,智能技术所拥抱的互联互通、共享开发思维能够重构不同评价主体的权利分配和利益博弈机制,促进多元评价主体立足多元需求即时获取有关评价对象的全面、客观评价结果,辅助个体和教育管理部门形成基于有效证据的循证决策。总之,人工智能正加速消解评价结果的片面僵化困境,持续赋能全景式教育测评体系的形成。二、现实隐忧:人工智能赋能教育评价改革的风险检视(一)评价制度和数据标准的缺位:阻隔教育评价的有效运行传统教育评价制度所
13、触发的“路径依赖”效应仍表征出不断强化的惯性阻力,致使当前人工智能赋能教育评价的制度供给明显滞后于评价技术的创新与应用。一是人工智能赋能教育评价的法律依据、应用规范等配套制度建设相对滞后,无法为教育评价实践提供制度保障。例如,尽管 总体方案对新时代教育评价发展的总体要求、重点任务和具体举措作了系统部署,并提及智能技术在各级各类评价中的重要功效。但总体方案中与涉及人工智能在教育评价应用相关配套制度的设计存在模糊不清和供给不足等问题。二是适应人工智能赋能教育评价的数据标准亟待完善。智能时代教育评价数据具有来源多元、采集复杂、类型庞杂、高速运转等特性,一定程度上亟须建立统一技术和数据标准,以确保评价
14、过程的规范化。相应数据和技术标准的缺位,一方面会导致不同教育平台或系统间数据的横向共享、纵向互动存在障碍,引发数据壁垒现象,评价数据只能散落于各个孤立的平台或系统。另一方面,不同教育情境下所采集的评价数据兼容性不强,导致数据冗余、整合困难,极易降低基于数据的教育评价的科学性。三是智能时代多元教育评价主体的权利和义务缺乏制度规范。缘于制度规范的匮乏,评价数据所有权和使用权可能过于集中在教育行政部门或部分技术专家手中,极易诱发教育评价的权力寻租风险。(二)技术至上的作祟:教育评价沦为一种控制模式技术崇拜和工具理性高扬笼罩下的教育评价实践,致使教育评价“成为生产人的手段、方式和过程,成为一种规训技术
15、”。8简言之,智能时代的教育评价异化为一种规定、控制教育的新模式。其一,评价主体的“机器僭越”。人工智能应用的工具理性偏执可能招致一些评价主体患上“技术依赖症”,机械地将评价数据收集和分析、评价指标建构、评价决策权力让渡给技术,评价主体与技术的“主辅关系”移位。随着各种智能评价系统的开发和应用,评价主体逐渐被这些智能技术和工具“捆绑”和“代理”,钝化其思维和认知,出现主体性危机。其二,评级体系的“算法规训”。一方面,算法设计者的主观偏见、算法思维的固有缺陷或训练数据的漏洞,会侵蚀评价过程的公平正义。如基于分数算法的评价系统会优先关注分数高的“好学生”而忽视分数低的“坏学生”,从而陷入“强者越强
16、,弱者越弱”的恶性循环。另一方面,桎梏于算法程序的复杂性、抽象性和排他性,可能导致评价结果不被理解,抑或使部分评价者为了谋取利益而作出有悖教育实际的评价决策。美国华盛顿特区于 2009 年开发了基于学生考试成绩的 IMPACT 教师评估模型,并在后续两年时间清理了评分比较低的 206 名“差”教师。在凯西奥尼尔(Cathy Oneil)看来:“人们很难对模型给出的分数提出质疑或者对抗由于一个正当性与准确性都极为可疑的模型,穷学校失去了一个好老师。”9其三,评价对象的“数据监控”。“量化一切”等思想的甚嚣尘上,迫使当前教育评价发生“凡是存在必有数量,既有数量即可测量”10的认识论转向。此种评价观统摄下的全数据教育评价俨然成为福柯(Foucault)笔下的全景敞视监狱,其作为一种隐性规人工智能赋能教育评价改革:发展态势、风险检视与消解对策-50训权力使评价对象不断“被注视、被观察、被详细描述、被一种不间断的书写逐日地跟踪”11。评价对象作为人的应然生命价值也被禁锢在数据枷锁之中,它赖以追求的情感、体验、创造、自由等属人特质也被数据和符号所监控、挟持或宰制,逐渐矮化为数据驯顺的肉身。(三)评