世界论坛网 > 时事新闻 > 正文  
专家实测6大AI工具可靠度 榜首出人意料
www.wforum.com | 2025-12-01 15:46:24  自由3C科技 | 0条评论 | 查看/发表评论

  现在人碰到问题,第一直觉反应就是问 AI!但是到底哪一个 AI 工具才最准确?或许每个人都有不一样的感受,对此英国消费者组织《Which?》就联合专家,针对六组常见的 AI 工具进行实测,结果 Gemini、ChatGPT 都无法获得最高分。

  《Which?》针对 ChatGPT、Google Gemini、Gemini AI Overview (Google 搜寻的 AI 摘要)、Microsoft Copilot、Meta AI 及 Perplexity 等六个工具进行测试,每个 AI 会被询问包含个人理财、法律、健康与饮食、消费者权益及旅游等不同面向、共 40 个问题,再由专家确认准确度、清晰度、实用性、伦理责任等指标,进而给出整体评分,结果如下(分数越高越好):

  1.Perplexity:71%

  2.Gemini AIO:70%

  3.Gemini 69%

  4.Copilot:68%

  5.ChatGPT:64%

  6.Meta AI:55%

  调查发现,AI 给予的答案存在许多隐忧,例如许多来源引用 Reddit 论坛或未知网站,并非来自权威内容,甚至有的 AI 会提供错误的理财、医疗资讯。当旅游碰到意外时,它甚至可能误导取消机票可以全额退费,或是对于票务规则本身就有错误理解,在法律上的专业度也明显不足,没有提醒消费者应该征询专业的法律建议。

  《Which?》科技专家 Andrew Laughlin 指出:“我们的研究发现,AI 有太多令人不安且不准确的误导性陈述,尤其是在碰到财务、法律谘询等重要议题时。”他警告用户,使用 AI 务必明确定义问题,并且仍要检查资讯来源,对于医疗、财务等复杂议题,一定要寻求专业谘询后,再做出重大决定。

What is Perplexity AI: The Future of Smart Search

(示意图)

(0)
当前新闻共有0条评论 分享到:
评论前需要先 登录 或者 注册
全部评论
暂无评论
查看更多
实用资讯
24小时新闻排行榜
照片曝光!中国利用民用货轮测试激光武器
《解放军报》遭中国网友狠酸
她一夜激战2男怀上双胞胎 两个孩子不同爸
习近平下令“敢于亮剑”
“我已经决定了!” 川普突发重磅表态
48小时新闻排行榜
照片曝光!中国利用民用货轮测试激光武器
《解放军报》遭中国网友狠酸
她一夜激战2男怀上双胞胎 两个孩子不同爸
习近平下令“敢于亮剑”
“我已经决定了!” 川普突发重磅表态
一个俄罗斯女孩和她的两任中国男友
中华田园犬这么好 为什么被禁养
中共国家保密局正副局长 惊爆同时被免职
香港宏福苑大火 让人看清了李嘉诚“真面
面试官:不录取你怎么办?小伙回4字被当场
热门专题
1中美对抗2以哈战争3乌克兰战争
4美国大选5李克强猝逝6新冠疫情
7香港局势8委内瑞拉9华为
10黑心疫苗11“低端人群”12美国税改
13红黄蓝幼儿园14中共19大15郭文贵
广告服务 | 联系我们 | 关于我们 | 网站导航 | 隐私保护
Jobs. Contact us. Privacy Policy. Copyright (C) 1998-2025. Wforum.COM. All Rights Reserved.