大学审查员未能在现实世界测试中发现chatgpt答案

亲自参加的考试使学生更难使用AI作弊trish gant / alamy没有发现使用Chatgpt创建的大学考试意见中有94%的人被发现是由人工智能产生的 ,而这些意见的分数往往比真正的学生的工作更高。

英国雷丁大学的彼得·斯卡夫(Peter Scarfe)及其同事使用Chatgpt为大学心理学本科学位的五个模块提供了63个评估问题的答案 。学生们在家里参加了这些考试,因此他们被允许查看笔记和参考文献,尽管不允许这样做 ,但他们可能会使用AI。

AI生成的答案是与真实学生的工作一起提交的,平均占学者标记的总脚本的5%。这些标记没有通知他们正在检查33名假学生的作品,他们的名字本身是由Chatgpt产生的 。

评估包括两种类型的问题:简短的答案和更长的论文。给Chatgpt的提示始于“包括对学术文献的引用 ,但不是单独的参考部分 ”,然后复制了考试问题。

在所有模块中,只有6%的AI提交被标记为可能不是学生自己的工作 - 尽管在某些模块中 ,没有AI生成的工作被标记为可疑的 。Scarfe说:“平均而言 ,AI回答的成绩比我们真正的学生提交的成绩更高。”

他补充说:“目前的AI倾向于在更抽象的推理和集成到信息中挣扎。”但是在所有63个AI提交中,AI的工作机会超过了学生的努力,有83.4%的机会 。

研究人员声称 ,他们的工作是迄今为止最大,最强大的研究 。尽管该研究仅检查了雷丁大学心理学学位的工作,但Scarfe认为这是整个学术领域的关注点。他说:“我没有理由认为其他主题领域不会遇到相同的问题。 ”

伦敦帝国学院的托马斯·兰开斯特(Thomas Lancaster)说:“结果完全表明了我期望看到的 。”“我们知道 ,生成的AI可以对简单,受约束的文本问题产生合理的回答。”他指出,包括简短答案在内的无监督评估始终容易受到作弊。

预计会标记工作的学者的工作量也无助于他们获得AI Fakery的能力 。兰开斯特说:“简短答案问题的时压缩标记不太可能在一时兴起地提出AI不当行为案件。 ”“我相信这不是发生这种情况的唯一机构。”

Scarfe说 ,在源头解决它将几乎不可能 。因此,该行业必须重新考虑其正在评估的内容。他说:“我认为,整个行业将要承认我们将不得不将AI纳入我们给学生的评估中。”


本文来自作者[admin]投稿,不代表东辰文化立场,如若转载,请注明出处:http://www.mzwhys.cn/zlan/202506-1399.html

(17)

文章推荐

发表回复

本站作者后才能评论

评论列表(4条)

  • admin
    admin 2025年06月16日

    我是东辰文化的签约作者“admin”!

  • admin
    admin 2025年06月16日

    希望本篇文章《大学审查员未能在现实世界测试中发现chatgpt答案》能对你有所帮助!

  • admin
    admin 2025年06月16日

    本站[东辰文化]内容主要涵盖:生活百科,小常识,生活小窍门,知识分享

  • admin
    admin 2025年06月16日

    本文概览:亲自参加的考试使学生更难使用AI作弊trish gant / alamy没有发现使用Chatgpt创建的大学考试意见中有94%的人被发现是由人工智能产生的,而这些意见的分数往往...

    联系我们

    邮件:东辰文化@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们