大学审查员未能在现实世界测试中发现chatgpt答案

admin • 2025年06月16日 05:54 • 作者专栏 • 阅读 17

亲自参加的考试使学生更难使用AI作弊trish gant / alamy没有发现使用Chatgpt创建的大学考试意见中有94％的人被发现是由人工智能产生的，而这些意见的分数往往比真正的学生的工作更高。

英国雷丁大学的彼得·斯卡夫（Peter Scarfe）及其同事使用Chatgpt为大学心理学本科学位的五个模块提供了63个评估问题的答案。学生们在家里参加了这些考试，因此他们被允许查看笔记和参考文献，尽管不允许这样做，但他们可能会使用AI。

AI生成的答案是与真实学生的工作一起提交的，平均占学者标记的总脚本的5％。这些标记没有通知他们正在检查33名假学生的作品，他们的名字本身是由Chatgpt产生的。

评估包括两种类型的问题：简短的答案和更长的论文。给Chatgpt的提示始于“包括对学术文献的引用，但不是单独的参考部分 ”，然后复制了考试问题。

在所有模块中，只有6％的AI提交被标记为可能不是学生自己的工作 - 尽管在某些模块中，没有AI生成的工作被标记为可疑的。Scarfe说：“平均而言，AI回答的成绩比我们真正的学生提交的成绩更高。”

他补充说：“目前的AI倾向于在更抽象的推理和集成到信息中挣扎。”但是在所有63个AI提交中，AI的工作机会超过了学生的努力，有83.4％的机会。

研究人员声称，他们的工作是迄今为止最大，最强大的研究。尽管该研究仅检查了雷丁大学心理学学位的工作，但Scarfe认为这是整个学术领域的关注点。他说：“我没有理由认为其他主题领域不会遇到相同的问题。 ”

伦敦帝国学院的托马斯·兰开斯特（Thomas Lancaster）说：“结果完全表明了我期望看到的。”“我们知道，生成的AI可以对简单，受约束的文本问题产生合理的回答。”他指出，包括简短答案在内的无监督评估始终容易受到作弊。

预计会标记工作的学者的工作量也无助于他们获得AI Fakery的能力。兰开斯特说：“简短答案问题的时压缩标记不太可能在一时兴起地提出AI不当行为案件。 ”“我相信这不是发生这种情况的唯一机构。”

Scarfe说，在源头解决它将几乎不可能。因此，该行业必须重新考虑其正在评估的内容。他说：“我认为，整个行业将要承认我们将不得不将AI纳入我们给学生的评估中。”

本文来自作者[admin]投稿，不代表东辰文化立场，如若转载，请注明出处：http://www.mzwhys.cn/zlan/202506-1399.html

17 4

本文作者

admin签约作者

2099 文章

10219 评论

1 粉丝

我是东辰文化的签约作者[admin],本篇文章《大学审查员未能在现实世界测试中发现chatgpt答案》主要讲述了:亲自参加的考试使学生更难使用AI作弊trish gant / alamy没有发现使用Chatgpt创建的大学考试意见中有94％的人被发现是由人工智能产生的，而这些意见的分数往往...

作者专栏

来自非洲的33亿年历史的奇怪的杂耍表现最古老的地震证据

科学家发现了33亿年历史的岩石中一些已知地震的迹象。岩石提供了早期的证据板块构造，这解释了地壳分成大板，这些板滑过地幔。岩石还指出了生命第一次进化时的条件可能是什么样的。　地质学家在调查了南部非洲复杂的地质形成巴伯顿绿岩带后，发现了这一发现。他们意识到，根据2月27日在《杂志》上发表的一项新研

admin
2025年06月09日
19
知识科普

如果您追求发烧友游戏耳机，那么不要错过有机会以Argos的最低价格抢购Audeze Maxwell

　　Rob是TechradarGaming的执行编辑，TechradarGaming是一名视频游戏记者，评论家，编辑和作家，并且拥有多个出版物的经验。在担任TechRadarGaming的执行编辑之前，他是TRG的副编辑，并且是GamesRadar+的长期成员，是硬件的调试编辑多年，同时在加入

admin
2025年06月11日
10
生活常识

'[他]试图通过将男性与小裤子一起安装：1700年代的精子科学来研究青蛙的施肥

在下面的摘录中，摘自“美丽的实验：实验科学的插图史”（芝加哥大学出版社，2023年），菲利普·鲍尔（PhilipBall）进入了17世纪和18世纪的实验，这些实验试图找出一个基本问题的答案：什么诱发了卵？从对精子的微观观察到青蛙的特殊精子裤，球揭示了我们如何了解受精。　始终很明显，对于人类和其

admin
2025年06月13日
21
作者专栏

PSVR 2已经令人赞叹的开发人员

　　在GDC2022上，许多开发人员一直在掌握PSVR2，尤其是一个开发人员与Sony的新耳机分享了他们的第一次体验。　　在Resetera（感谢PushSquare）的帖子中，TruantPixel的匿名开发人员对索尼对耳机的设计和功能的方法有积极的说法。　　开发商说：“索

admin
2025年06月13日
11
生活常识

“这可能为新颖的艺术表达形式铺平道路'：生成的AI对艺术家而言并不威胁；这是重新定义艺术本身的机会

人工智能（AI）威胁要破坏的关键领域之一是人类的创造力＆mdash;生成性AI的兴起无疑将艺术置于焦点。尽管人们仍然担心AI可能会取代人类的投入和代理，但另一种方法表明，人类会以某种方式与AI融为一体。随着新技术的增强，而不是破坏我们。在”Centaur艺术：生成AI时代的艺术未来”（施普林格

admin
2025年06月13日
13
知识科普

研究人员说

一项新的研究报道，由于北极状况的变化，北极熊正在爪子上造成可怕的伤口。在最严重的情况下，研究人员描述了两只熊，上面有残酷的餐盘大小的冰球。在冰球下，熊的爪子被深深的出血切割覆盖。“我以前从未见过。”克里斯汀·莱德雷（KristinLaidre）华盛顿大学的海洋生态学家和副教授陈述。“这两只受影

admin
2025年06月15日
10
知识科普

不，美国国家航空航天局（NASA）尚未警告2038年即将来临的小行星罢工。这是真正发生的事情。

NASA和其他国际组织的官员最近完成了一项模拟测试，以评估他们对2038年可能坠入地球的假设小行星做出反应的能力。　桌面练习按计划进行，并在很大程度上被参与其中的人视为成功。但是，几个媒体已经误报了发生的事情，要么看来影响场景是真实的，要么我们感到不舒服地处理它。这两个都是真的。　在4月2日至4月3

admin
2025年06月15日
18
知识科普

歌曲作者AI在朋友的帮助下效仿甲壳虫乐队

平均而言，人们获得了AI生成的甲壳虫歌曲5分。DovMakabawSundry/Alamy成千上万的词曲作者磨练了他们的技能，听甲壳虫乐队-现在还有一位。拥有社交网络Snapchat的公司Snap团队开发的AI已学会了以FabFour的风

admin
2025年06月16日
44
生活常识

小腿胸腺细胞的六个组蛋白的氨基酸组成

　　感谢您访问Nature.com。您使用的是浏览器版本对CSS的支持有限。获得　　最佳体验，我们建议您使用更多最新的浏览器（或关闭兼容模式　　InternetExplorer）。同时，为了确保继续支持，我们正在展示网站，没有样式　　和JavaScript。

admin
2025年06月18日
9
百科大全

123

Rar!

admin
2025年06月18日
9

发表回复

本站作者后才能评论

评论列表（4条）

admin 2025年06月16日

我是东辰文化的签约作者“admin”！

回复
admin 2025年06月16日

希望本篇文章《大学审查员未能在现实世界测试中发现chatgpt答案》能对你有所帮助！

回复
admin 2025年06月16日

本站[东辰文化]内容主要涵盖：生活百科,小常识,生活小窍门,知识分享

回复
admin 2025年06月16日

本文概览：亲自参加的考试使学生更难使用AI作弊trish gant / alamy没有发现使用Chatgpt创建的大学考试意见中有94％的人被发现是由人工智能产生的，而这些意见的分数往往...

回复

大学审查员未能在现实世界测试中发现chatgpt答案

本文作者

文章推荐

发表回复

评论列表（4条）

联系我们