全球播报:效率“狂飙”的AI阅卷:高考只作辅助工具 中考已用于实验操作“打分”

来源:21世纪经济报道 2023-06-28 15:20:45

连日来,全国各地的高考、中考作文题目勾起了不少网友“整活”的兴趣。大家纷纷好奇,让ChatGPT、文心一言等“上考场”,AI生成的作文能拿多少分?


(资料图片)

AI的应用场景远不止于此。一众网友用AI写作文的另一面,进入封闭式管理的阅卷老师们或许正在用AI改试卷。

有AI公司透露,一个省份的高考数学试卷通常需要上百位老师耗费一周左右时间批改,而AI只需要20小时。

针对数理化生等评分标准相对清晰的科目,基于深度强化学习框架的AI阅卷正逐渐普及,人机一致率已达到预期。网易有道、科大讯飞等头部企业又切入了作文批改赛道,但限于“一千个读者眼中有一千个哈姆雷特”,在中高考这类高利害性考试中,AI阅卷远不能取代人工。

根据教育部办公厅近日印发的《基础教育课程教学改革深化行动方案》,针对讲得多做得少、学生对科学技术缺乏内在兴趣等问题,国家明确要加强实验教学,强化学生动手操作实验,将实验操作纳入中考。

当实验操作直接与升学挂钩,相关考核仅依赖人工评分,将面临人力成本高、效率低,无法大规模推广的问题。而AI的介入,或将有效解决这些痛点。

20小时完成一省份高考数学辅助阅卷

近日,2023全国各省份高考陆续放榜。以6月25日出分的广东省为例,距13日评卷工作正式开始,过去了接近两周。

记者了解到,目前高考客观题可由光标阅读机扫描处理,主观题虽实现了无纸化阅卷,但判分仍高度依赖人工。机器扫描后的答题卡会按题目切割成若干个试题块图片,屏蔽考生信息后,再随机分派给评卷教师评阅。

数据显示,2023年全国高考报名人数1291万人,比去年增加98万人,创历史新高。其中广东省报名人数达73.9万人,实际参加考试70万人,需评阅的试卷答题卡约420万份,全省共选聘了近6000名评卷教师,耗费的人力物力不容小觑。

这也让国内不少教育科技公司意识到,阅卷是一个需求庞大且稳定的赛道,若破除解题思路多样、手写字体各异等主观题批改的痛点,AI阅卷市场前景广阔。

当AI介入高考,评卷效率究竟能提高多少?可之科技提供了一个鲜明案例。

据介绍,该公司自2021年起参与到江苏、湖南、甘肃等十余个省份的高考网上评卷监测工作中,今年更是在20个小时内完成了一个省份全部考生数学学科的辅助阅卷工作,而传统阅卷通常需要数十位甚至数百位老师耗费一周左右时间。

可之科技提到,团队基于自主研发的深度强化学习框架,不断提高复杂手写识别精确度、主观题型批改准确度。目前,AI已可以自动穷举题目的全部正确解法,判断考生作答逻辑以及最终结果的正确性并给出评分,辅助人工评卷结果的验证。

AI阅卷赛道上也不乏网易有道、科大讯飞等头部企业的身影。

近日,网易有道上线中文作文批改服务,基于深度学习网络技术,可从文本纠错、主题分析、总体打分、总体评价、好句好词分析等多个维度评价作文,利用语言模型生成评语和修改意见,向用户提供写作指导建议。

科大讯飞的智能评卷系统,则是基于手写识别、自然语言理解、智能评测等AI核心技术研发,据称可实现语文作文、英语作文、英语翻译、文综类简答题、英语填空题等题型的AI评卷。

目前,科大讯飞已在大学英语四六级、部分省份中高考等场景开展试点,辅助人工阅卷,据称可减少人工约80%的批改工作量。

“越能有一个清晰、细致、可量化的评分标准,AI阅卷就越可信,因此数理化生的AI阅卷相对更容易实现。语文、英语等科目虽也有落地案例,但困难不在于技术水平达不到,而是每个人有不同的审美品位,AI评分结果不容易被完全认可。” 深圳市政协常委、码隆科技CEO黄鼎隆告诉记者。

记者了解到,面对语文、英语作文,AI通常会先学习大量老师批改作文时形成的大数据,梳理出一套评分标准再进行阅卷,但难逃“一千个读者眼中有一千个哈姆雷特”的困境。

科大讯飞考试与语言学习产品线副总经理竺博也曾公开表示,AI阅卷是发展潮流,但不会完全取代人工。尤其在高考这种高利害性的考试中,AI更多扮演工具角色。

AI应用于实验操作催生新蓝海

6月26日,2023深圳中考顺利开考,为期三天。今年深圳中考的一大特殊性在于,物理、化学实验操作考试最后一年以“合格与待合格”形式计入考生档案。

近日,教育部办公厅印发《基础教育课程教学改革深化行动方案》,提出要加强实验教学,强化学生动手操作实验,将学校实验课开设情况纳入教学视导和日常督导,将实验操作纳入中考。

据了解,深圳2023年将生物实验操作考试成绩按等级分计入中考生物科目考查成绩,2024届毕业生的物理、化学实验操作考试成绩将按笔试成绩的10%计入中考总分,直接与中考升学挂钩。

深圳现行的初中物化生实验操作考试,单科实验考核时间为5分钟,大致有即考即评、先考后评两种形式。

前者,老师需凭肉眼当场评判学生的操作是否规范,一位学生就需要5分钟甚至以上的评分时间。后者以视频记录考试全程,老师回看视频评分,可适度快进,也支持回放复核,效率虽有所提升,但以2022年深圳中考11.2万人的考生规模计算,所需的人力成本仍居高不下。

实验操作场景下,AI又将如何发挥作用?

“AI批改传统卷面,处理的多是图像数据。实验操作考核中,AI处理的是视频数据,是连续的动作,算法相对更复杂,对算力的消耗也更大。AI需要将操作动作和实验器材识别出来,并理解考生在操作什么步骤、是否符合给分标准。”黄鼎隆分析道。

5月下旬,珠海、深圳等大湾区城市相继组织初中理化生实验操作考试考核,码隆科技“教考评”一体化智慧实验解决方案得以应用。

以全局摄像头、细节摄像头等硬件代替人眼,配以相关算力算法,AI可以精准检测并在视频中标注出“胶头滴管伸入量筒”“没有清洗仪器”等操作失误,予以扣分后,教师可在AI评分基础上复核成绩,极大减轻阅卷负担。

虽然对算力算法的要求更高,但好在物化生实验操作的评判标准相对清晰,且近年来相关AI技术屡有突破性进展,AI实验测评的落地也在快步推进。黄鼎隆透露,目前智慧实验解决方案经人工复核评定的人机一致率已接近100%。

除应用在考试场景,码隆科技还在深圳外国语学校等多所市属学校和各区重点学校开展日常实验操作课堂的试点。利用AI分析每个学生的实验得分情况、用时长短、薄弱环节等,授课老师将有的放矢开展实验教学。

今年年初,深圳市教育局印发《深圳市深化初中阶段理科实验教学与测评改革的实施意见(试行)》,要求学校保障基础性实验开足开齐,确保实验开出率100%,拓展性实验比例不少于50%,同时要按相关标准配置实验教学和测评的器材、设备、试剂和相关的大数据管理平台。

据相关机构预测,今年深圳中考人数或达到12.6万。而《深圳市2022年国民经济和社会发展统计公报》显示,截至2022年底,深圳有普通中学521所,在校学生61.63万人。这也意味着,在AI阅卷这一新兴赛道上,实验操作测评或将催生一片新蓝海。

} 关键词:

相关新闻