世界论坛网 > 时事新闻 > 正文  
韩国让4款AI测验大学入学考试 ChatGPT得分曝光
www.wforum.com | 2025-11-15 15:21:28  自由时报 | 0条评论 | 查看/发表评论

假设AI是一名参加大学入学考试的学生,它会得到怎样的成绩呢?韩联社与延世大学教授金时浩(김시호)的研究团队合作,使用ChatGPT(GPT-5)、Gemini(2.5Flash)、Perplexity(Sonar)的免费版本以及DeepSeek的最新模型,挑战测验2026年韩国大学入学考试(대학수학능력시험,简称CSAT)的韩语、英语与数学。

根据《韩联社》 报道,研究团队让4款热门AI参加大考,实测如果这些人工智慧是真正的考生,它们可能会就读哪些大学。为了确保测试环境与考试规定和韩国大学入学考试相同,所有的AI禁止搜寻网络,并被要求自行解决问题。

在测试中获得第一名高分的模型是ChatGPT,尤其“数学”表现出色,尽管今年的数学题目,因穿插了大量高难度题目而被评为难度较高的考科,但ChatGPT仍然取得了优秀成绩。

第二高分则是DeepSeek,它在韩语和英语方面的得分高于GPT,但由于其数学得分较低,导致其总分下降。

Gemini在数学方面表现出了较高的准确率,与ChatGPT类似,但可惜其韩语得分垫底。

而整体得分最低的是Perplexity,测试过程中经常出错,例如在测试过程中突然拒绝回答,而且难以准确测量测试时间,此外,还违反CSAT考试规定,像是在考试期间上网搜寻资讯。

金时浩(김시호)教授表示:“尽管人工智慧模型取得了显著进步,但它们在韩语的表现仍然不尽如人意,似乎无法解决我们所设想的高层次问题”。

韩国让4款AI测验大学入学考试 ChatGPT得分曝光

ChatGPT在研究中赢得韩国大学入学考试的最高分。示意照。(美联社)

(0)
当前新闻共有0条评论 分享到:
评论前需要先 登录 或者 注册
全部评论
暂无评论
查看更多
实用资讯
24小时新闻排行榜
突发!川普:习近平已经同意了
全球唯一空射核弹:超音速射程8000公里
乌克兰应体面止损 历史不会为政治表演颁奖
中方对日打法有变 川普急电高市早苗交底
堪称奇迹!歼-50驯服兰姆达翼固有缺陷
48小时新闻排行榜
突发!川普:习近平已经同意了
全球唯一空射核弹:超音速射程8000公里
乌克兰应体面止损 历史不会为政治表演颁奖
中方对日打法有变 川普急电高市早苗交底
堪称奇迹!歼-50驯服兰姆达翼固有缺陷
在琉球部署中程导弹,日本这招险在哪儿?
美军下命令:日本有事就是美国有事
美军双航母接力打捞南海坠机,意味什么?
中国六代机新样机使用矢量喷口
B-52的8台发动机:是动力澎湃,还是落后设
热门专题
1中美对抗2以哈战争3乌克兰战争
4美国大选5李克强猝逝6新冠疫情
7香港局势8委内瑞拉9华为
10黑心疫苗11“低端人群”12美国税改
13红黄蓝幼儿园14中共19大15郭文贵
广告服务 | 联系我们 | 关于我们 | 网站导航 | 隐私保护
Jobs. Contact us. Privacy Policy. Copyright (C) 1998-2025. Wforum.COM. All Rights Reserved.