专栏名称: 北京师范大学图书馆
发布图书馆信息,提供咨询服务
目录
相关文章推荐
正午故事  ·  被“电诈”PUA的高学历者们 ·  昨天  
三联生活周刊  ·  福建没有的“福建面”,成了这座城的顶流小店? ·  2 天前  
新周刊  ·  为什么成年后,毛绒玩具更重要了 ·  3 天前  
三联生活周刊  ·  给企业大佬写演讲稿的我,对“预制金句”过敏了 ·  3 天前  
51好读  ›  专栏  ›  北京师范大学图书馆

人工智能会让现行考试过时吗?|《世界教育动态》2024年第21期先睹为快!

北京师范大学图书馆  · 公众号  ·  · 2024-11-28 09:00

正文

人工智能 会让现行考试过时吗?

一些最受欢迎的标准化考试的供应商正在重新考虑他们的产品,并探索新的方法来进行考试和评分,因为新的人工智能工具正在挑战传统的学生知识评估技术。例如,作为标准化考试领域历史最悠久、规模最大的机构之一,美国教育考试服务中心(ETS)正在逐步放弃SAT等传统的大学入学考试,转而专注于采用新的方法来衡量学生的技能和毅力。

对于学术考试而言,这是一个动荡的时期,对于有75年历史的非营利机构ETS来说更是如此。在新冠疫情期间,出于对公平性和可及性的担忧,至少1600所大学将SAT等入学考试列为可选项。今年早些时候,ETS表示,它将不再为大学理事会管理SAT考试。大学理事会发言人霍莉·斯特普表示,由于该组织已经完全转向数字化形式,“我们现在直接开发并管理SAT及与PSAT相关的评估。”

今年4月,ETS启动了一项品牌重塑计划, 将重点放在所谓的“人才解决方案”上 而不仅仅是学术测试。 在去年9月裁员6%之后,今年早些时候,它又向大量员工提供了买断服务。ETS产品创新与开发副总裁卡拉·麦克威廉姆斯表示:“ ETS未来提供的评估将更偏重行为而非认知。”她补充说:“这意味着我们将创造一些体验,从而能够衡量用户行为,而不是他们对问题的答案。我们并不真正关心答案是什么,而是关心你是如何得出答案的。 ”这项工作的一个例子是,该组织的新重点是“未来技能”计划,这是与卡内基教学促进基金会联合开展的一项旨在重新构想评估方式的项目。卡内基基金会主席蒂莫西·诺尔斯说,这项工作的目标是不再要求学生停止一切活动,坐在房间里回答几个小时的问题。 相反,卡内基基金会正在尝试利用学校掌握的学生数据——包括体育、俱乐部和实习等课余活动的数据——来衡量和跟踪学生在沟通、协作和批判性思维等技能方面的进步。他说:“我们的想法是建立一个对孩子、家庭和教育工作者有用的洞察系统。这样他们就会了解人们在发展这些技能方面的发展轨迹,而这些技能是预测成功的指标。所以我们正在探索一种有效方式以非惩罚性、非问题性的方式将这些信息可视化。” 他说,学校已经拥有丰富的数据,但他们并没有充分利用这些数据。问题在于“你能否从不同的角度看待这些数据,并从这些数据中推断出一个年轻人在多大程度上发展了某些技能?”

诺尔斯说,该项目已与印第安纳州、内华达州、北卡罗来纳州、罗德岛州和威斯康星州这五个州的教育领导者建立了合作关系,并从明年1月开始对该方法进行试点测试。ETS和卡内基基金会的官员表示,他们将使用新的人工智能形式来做一些事情,比如审查和标记现有的学生作业,分析州教育数据,以及进行互动评估。

然而,专家们呼吁要谨慎行事,特别是在使用人工智能分析数据和构建试题时。

布鲁金斯学会技术创新中心主任尼科尔·特纳·李说:“关于人工智能的使用是否存在偏见,我们还有很多需要学习的地方。人工智能的好坏取决于训练数据,如果训练数据仍然偏向于拥有更多资源的特权学生,而不是来自弱式学校的学生,这势必会产生负面影响。”她提到了2020年的一次有争议的实验,当时正值新冠疫情高峰期,许多学校不得不关闭并进行线上授课。由于许多学生无法亲自参加国际文凭组织提供的线下年终考试,该组织决定建立一个模型,根据历史数据预测学生的分数。他们开发了一种算法,预测哪些学校更有可能培养出高质量的毕业生。但数以千计的学生对他们的分数提出投诉,一些政府也展开了正式调查。特纳·李表示:“这一算法本身并没有考虑到学校的位置和资源。”

这位研究人员说,ETS官员请她在最近的一次活动上发言,她在会上分享了自己对在测试和评估中使用人工智能的看法和担忧。她说:“想想我们在解决标准化测试中的不平等问题上付出了多大的努力。你要对全盘接受保持谨慎,因为训练人工智能的那些数据集很有可能在历史上就存在偏见。”

其他考试机构也在尝试使用人工智能来创造新型试题。明年的国际学生评估项目(以下简称PISA)考试(一项衡量15岁学生阅读、数学和科学素养的国际测试)预计将包括新型“表现任务”,旨在考察学生如何处理问题,这些任务将由人工智能进行评分。

ETS的麦克威廉姆斯说,在过去的一年里,她对人工智能在测试中的应用的看法有了“心态上的转变”。去年,她的重点是利用人工智能帮助创建传统的选择题,而现在她真正关注的是动态生成内容,针对更多的体验式任务,让个人能够最有意义地展示他们所知道的和能够做到的事情。其中一个例子是一款名为“真实面试准备”的新人工智能工具,它利用人工智能帮助人们磨练求职面试技巧。她说:“很多人都会在面试时紧张,因此我们要做的就是创造体验,让人们了解如何更有意义地进行面试。人工智能会作出一些反馈,比如我的语气、语速或眼神交流,并在手表上进行触觉提示。”

当然,这种测试与进入大学或研究生院无关,这是一种与SAT不同的测量方式。麦克威廉姆斯表示,在可预见的未来,SAT考试仍将发挥一定的作用:“我现在想的是,我们要创造什么样的内容来帮助人们应对他们每天都在接触的体验?”

信息来源

信息来源:教育浪潮(EdSurge)网站

Jeffrey R. Young. Will AI Make Standardized Tests Obsolete? [EB/OL]. (2024-08-29)[2024-09-18]. https://www.edsurge.com/news/2024-08-29-will-ai-make-standardized-tests-obsolete

编译:林越坤   校对:唐小晰

2024年第21期 目录

左右滑动,阅读更多

政策参考

欧洲和北美洲

美国:发布高等教育生成式人工智能使用评估报告

英国:高等教育质量保障署发布合作办学审查报告

德国:北莱茵-威斯特法伦州通过强化高等教育法草案

俄罗斯:沃罗涅日州出台青年教师支持措施

西班牙:马德里自治区推出“森林岛”环保教室

亚洲和太平洋地区

韩国:建设新的教师能力发展支持制度

新西兰:大学重新采用纸笔考试模式

非洲

喀麦隆:庆祝国际扫盲日

教育组织

经济合作与发展组织:发布关于欧盟绿色教育的案例研究

联合国儿童基金会:发布《儿童和青少年的心理健康服务指南》







请到「今天看啥」查看全文