世界论坛网 > 时事新闻 > 正文  
蒙娜丽莎让大模型们全军覆没 AI不会眯眼睛?
www.wforum.com | 2025-07-06 13:07:01  量子位 | 0条评论 | 查看/发表评论

又一个让大模型几乎全军覆没的难题出现了。

注意看,这张图画的是谁?

如果不够明显,那再眯着眼睛看呢。没错,就是蒙娜丽莎。

这张来自日本艺术家北冈秋吉前几天创作的一张图,结果直接把一众大模型难倒了。

ChatGPT只能分辨出这是一张脸。。

Gemini则是直接识别错了人。

网友:懂了,大模型不会眯眼睛。

大模型不会眯眼睛?

为了验证这一推论,咱们也进行了一波简单实测。既然直接问“画的是谁”问不出来,那给一点提示,让它可以尝试眯着眼睛。

首先来看ChatGPT的表现。

它能准确判断出这是一张视觉错位图,也通过“眯着眼睛”识别出来了具体的脸部轮廓,结果在最后关头识别错了。

而再让它深度思考一下,答案给不出来了。

Gemini的回答则还停留在各种颜色的条纹,也辨认出这是个侧脸的轮廓。

Grok则直接表示无法辨认,让我提供一张更清晰的照片,emmm…

再来看看国产玩家的表现,还是挑出三个来看看。

豆包的回答与Gemini类似,能够判断出图像的风格、人脸轮廓,但是无法判断具体任务。

但选择深度思考之后,它深入研究了故障艺术的通道分离特性,然后从黑色轮廓中判断出这是爱因斯坦(????

可能这蓬松的长发不是一个类型的吧。

将这个问题交给Qwen。负责回答这个问题的是Qwen3-235B-A22B,在完成深度思考之后,它发现了这是个人的侧脸剪影。但还是没有判断出画的这个人是谁。

而元宝、讯飞的回答如下:

△元宝△元宝

△讯飞星火△讯飞星火

但o3-Pro一次性回答对

不过在一众模型全军覆没之际,也还是有得分选手。

比如o3-Pro。

网友进一步分析了原因。这可能与模型推理轨迹有关。比如像o3(非pro版)思考链路里,它通常会在 Python 中旋转、增加对比度、裁剪等。而o3-pro显然推理能力更强。

但有人怀疑了,它是不是用搜索了。

不过这被发现者驳回了。首先o3也可以用搜索,但无法做到这一点。而且从o3-pro的推理摘要中看,它只有在模糊后才能看到它(可能是通过使用工具)。而且如果只问“这是什么?”,它也不起作用。

还有尝试了三次的GPT-4o。

不过这合理怀疑,只是它偶然猜对了。

因为网友在它第一次打错之后,就给模型提示说这是一张著名的画作。于是就莫名玩起了“海龟汤”的游戏。。。

又或者让o4-mini-high先人为地模糊图像以使其“眯眼”,然后就能识别图像。

(0)
当前新闻共有0条评论 分享到:
评论前需要先 登录 或者 注册
全部评论
暂无评论
查看更多
实用资讯
24小时新闻排行榜
兰德公司预测俄乌战争后果,内容炸裂
目前见到的J-15和J-15T最好的对比图
焕然一新!福建舰已经做好服役准备
趴窝印度20天后,英国打算将F35B拆散带走
中国远火卫星制导模块曝光,精度小于3米
48小时新闻排行榜
兰德公司预测俄乌战争后果,内容炸裂
目前见到的J-15和J-15T最好的对比图
焕然一新!福建舰已经做好服役准备
趴窝印度20天后,英国打算将F35B拆散带走
中国远火卫星制导模块曝光,精度小于3米
伊朗如果想采购中国武器,这个忙能帮吗?
北京突然宣布这事 台湾急了 强烈遗憾
俄罗斯击落阿塞拜疆客机出现新证据
东方传来巨响 中国人简直不敢相信自己的好
不用中国一颗螺丝?印军全面排查中国零件
热门专题
1中美对抗2以哈战争3乌克兰战争
4美国大选5李克强猝逝6新冠疫情
7香港局势8委内瑞拉9华为
10黑心疫苗11“低端人群”12美国税改
13红黄蓝幼儿园14中共19大15郭文贵
广告服务 | 联系我们 | 关于我们 | 网站导航 | 隐私保护
Jobs. Contact us. Privacy Policy. Copyright (C) 1998-2025. Wforum.COM. All Rights Reserved.