世界论坛网 > 时事新闻 > 正文  
专家实测6大AI工具可靠度 榜首出人意料
www.wforum.com | 2025-12-01 15:46:24  自由3C科技 | 0条评论 | 查看/发表评论

  现在人碰到问题,第一直觉反应就是问 AI!但是到底哪一个 AI 工具才最准确?或许每个人都有不一样的感受,对此英国消费者组织《Which?》就联合专家,针对六组常见的 AI 工具进行实测,结果 Gemini、ChatGPT 都无法获得最高分。

  《Which?》针对 ChatGPT、Google Gemini、Gemini AI Overview (Google 搜寻的 AI 摘要)、Microsoft Copilot、Meta AI 及 Perplexity 等六个工具进行测试,每个 AI 会被询问包含个人理财、法律、健康与饮食、消费者权益及旅游等不同面向、共 40 个问题,再由专家确认准确度、清晰度、实用性、伦理责任等指标,进而给出整体评分,结果如下(分数越高越好):

  1.Perplexity:71%

  2.Gemini AIO:70%

  3.Gemini 69%

  4.Copilot:68%

  5.ChatGPT:64%

  6.Meta AI:55%

  调查发现,AI 给予的答案存在许多隐忧,例如许多来源引用 Reddit 论坛或未知网站,并非来自权威内容,甚至有的 AI 会提供错误的理财、医疗资讯。当旅游碰到意外时,它甚至可能误导取消机票可以全额退费,或是对于票务规则本身就有错误理解,在法律上的专业度也明显不足,没有提醒消费者应该征询专业的法律建议。

  《Which?》科技专家 Andrew Laughlin 指出:“我们的研究发现,AI 有太多令人不安且不准确的误导性陈述,尤其是在碰到财务、法律谘询等重要议题时。”他警告用户,使用 AI 务必明确定义问题,并且仍要检查资讯来源,对于医疗、财务等复杂议题,一定要寻求专业谘询后,再做出重大决定。

(0)
当前新闻共有0条评论 分享到:
评论前需要先 登录 或者 注册
全部评论
暂无评论
查看更多
实用资讯
24小时新闻排行榜
不如印度?中国护卫舰054B服役即落伍
乌特种部队突袭 多名俄军上将疑在会议中阵
朝鲜伤亡比想象中惨烈 2400人血洒库尔斯克
没有了美国的弹药,乌东防线脆得像张纸
马里防长战死,“反恐神话”破灭
48小时新闻排行榜
不如印度?中国护卫舰054B服役即落伍
乌特种部队突袭 多名俄军上将疑在会议中阵
朝鲜伤亡比想象中惨烈 2400人血洒库尔斯克
没有了美国的弹药,乌东防线脆得像张纸
马里防长战死,“反恐神话”破灭
一架没人开的加油机,凭什么值61亿美元?
“蓝鲨”!歼-35隐身舰载机正式命名
实锤!乌克兰用上顶级空空弹AIM-120C-8
疯了?美国版056单舰造价将超百亿元
雷达瞎了!共军这回真把脸丢到海里了
热门专题
1中美对抗2以哈战争3乌克兰战争
4美国大选5李克强猝逝6新冠疫情
7香港局势8委内瑞拉9华为
10黑心疫苗11“低端人群”12美国税改
13红黄蓝幼儿园14中共19大15郭文贵
广告服务 | 联系我们 | 关于我们 | 网站导航 | 隐私保护
Jobs. Contact us. Privacy Policy. Copyright (C) 1998-2026. Wforum.COM. All Rights Reserved.