蒙娜丽莎让大模型们全军覆没 AI不会眯眼睛？-时事新闻-世界论坛网（电脑版）

首页

即时

热点

图片

论坛

简体/繁体 | 广告服务 | 联系我们 | 关于我们 |

世界论坛网 > 时事新闻 > 正文

蒙娜丽莎让大模型们全军覆没 AI不会眯眼睛？
www.wforum.com \| 2025-07-06 13:07:01 量子位 \| 0条评论 \| 查看/发表评论




又一个让大模型几乎全军覆没的难题出现了。注意看，这张图画的是谁？如果不够明显，那再眯着眼睛看呢。没错，就是蒙娜丽莎。这张来自日本艺术家北冈秋吉前几天创作的一张图，结果直接把一众大模型难倒了。 ChatGPT只能分辨出这是一张脸。。 Gemini则是直接识别错了人。网友：懂了，大模型不会眯眼睛。大模型不会眯眼睛？为了验证这一推论，咱们也进行了一波简单实测。既然直接问“画的是谁”问不出来，那给一点提示，让它可以尝试眯着眼睛。首先来看ChatGPT的表现。它能准确判断出这是一张视觉错位图，也通过“眯着眼睛”识别出来了具体的脸部轮廓，结果在最后关头识别错了。而再让它深度思考一下，答案给不出来了。 Gemini的回答则还停留在各种颜色的条纹，也辨认出这是个侧脸的轮廓。 Grok则直接表示无法辨认，让我提供一张更清晰的照片，emmm… 再来看看国产玩家的表现，还是挑出三个来看看。豆包的回答与Gemini类似，能够判断出图像的风格、人脸轮廓，但是无法判断具体任务。但选择深度思考之后，它深入研究了故障艺术的通道分离特性，然后从黑色轮廓中判断出这是爱因斯坦（？？？？可能这蓬松的长发不是一个类型的吧。将这个问题交给Qwen。负责回答这个问题的是Qwen3-235B-A22B，在完成深度思考之后，它发现了这是个人的侧脸剪影。但还是没有判断出画的这个人是谁。而元宝、讯飞的回答如下： △元宝 △讯飞星火但o3-Pro一次性回答对不过在一众模型全军覆没之际，也还是有得分选手。比如o3-Pro。网友进一步分析了原因。这可能与模型推理轨迹有关。比如像o3（非pro版）思考链路里，它通常会在 Python 中旋转、增加对比度、裁剪等。而o3-pro显然推理能力更强。但有人怀疑了，它是不是用搜索了。不过这被发现者驳回了。首先o3也可以用搜索，但无法做到这一点。而且从o3-pro的推理摘要中看，它只有在模糊后才能看到它（可能是通过使用工具）。而且如果只问“这是什么？”，它也不起作用。还有尝试了三次的GPT-4o。不过这合理怀疑，只是它偶然猜对了。因为网友在它第一次打错之后，就给模型提示说这是一张著名的画作。于是就莫名玩起了“海龟汤”的游戏。。。又或者让o4-mini-high先人为地模糊图像以使其“眯眼”，然后就能识别图像。

当前新闻共有0条评论	分享到：

评论前需要先登录或者注册哦

全部评论

暂无评论

	实用资讯

24小时新闻排行榜

	兰德公司预测俄乌战争后果，内容炸裂
	目前见到的J-15和J-15T最好的对比图
	焕然一新！福建舰已经做好服役准备
	趴窝印度20天后，英国打算将F35B拆散带走
	中国远火卫星制导模块曝光，精度小于3米

48小时新闻排行榜

	兰德公司预测俄乌战争后果，内容炸裂
	目前见到的J-15和J-15T最好的对比图
	焕然一新！福建舰已经做好服役准备
	趴窝印度20天后，英国打算将F35B拆散带走
	中国远火卫星制导模块曝光，精度小于3米
	伊朗如果想采购中国武器，这个忙能帮吗？
	北京突然宣布这事台湾急了强烈遗憾
	俄罗斯击落阿塞拜疆客机出现新证据
	东方传来巨响中国人简直不敢相信自己的好
	不用中国一颗螺丝？印军全面排查中国零件

热门专题

1	中美对抗	2	以哈战争	3	乌克兰战争
4	美国大选	5	李克强猝逝	6	新冠疫情
7	香港局势	8	委内瑞拉	9	华为
10	黑心疫苗	11	“低端人群”	12	美国税改
13	红黄蓝幼儿园	14	中共19大	15	郭文贵

广告服务 | 联系我们 | 关于我们 | 网站导航 | 隐私保护

Jobs. Contact us. Privacy Policy. Copyright (C) 1998-2025. Wforum.COM. All Rights Reserved.