世界论坛网 > 时事新闻 > 正文  
DeepSeek新模型因使用华为芯片难产?
www.wforum.com | 2025-08-14 07:44:28  RFI | 0条评论 | 查看/发表评论

中国人工智能公司 DeepSeek 因使用华为昇腾系列芯片进行训练受挫而推迟了其第二代模型的发布,凸显了中国政府力推取代美国技术的局限性。

《金融时报》报道引述据三位知情人士透露,DeepSeek 在 1 月份发布其 R1模型后,受到当局的鼓励,采用华为 ,而不是使用英伟达的处理器。但知情人士表示,这家中国初创公司在使用 华为昇腾系列Ascend 芯片进行 R2 模型训练的过程中遇到了持续的技术问题,促使其使用英伟达芯片进行训练,使用华为芯片进行推理。

一位知情人士表示,这些问题是该模型发布日期从 5 月推迟的主要原因,导致其落后于竞争对手。

训练是指模型从大型数据集中学习,而推理是指使用训练好的模型进行预测或生成响应(例如聊天机器人的查询)的步骤。

《金融时报》分析指出,DeepSeek 的困境表明,中国芯片在关键任务上仍落后于美国竞争对手,凸显了中国在技术自给自足方面面临的挑战。

有报道称,中国政府已要求中国科技公司解释其订购英伟达H20芯片的合理性,以鼓励它们推广华为和寒武纪的替代产品。业内人士表示,与英伟达的产品相比,中国芯片存在稳定性问题、芯片间连接速度较慢以及软件质量较差等问题。

据两位知情人士透露,华为派了一个工程师团队前往 DeepSeek 的办公室,帮助该公司使用其 AI 芯片开发 R2 模型。然而,尽管团队在现场,DeepSeek 仍无法在昇腾芯片上成功进行训练。

知情人士表示,DeepSeek仍在与华为合作,以使该模型与昇腾芯片兼容进行推理。

DeepSeek创始人梁文锋内部曾表示,他对R2的进展不满意,并一直在努力投入更多时间构建更先进的模型,以保持公司在人工智能领域的领先地位。

另一位知情人士补充说,R2 的发布也因更新模型的数据标注时间长于预期而被推迟。中国媒体报道称,该模型最早可能在未来几周内发布。

图为 2025 年 1 月 27 日拍摄的 Nvidia 和 DeepSeek 徽标。

图为 2025 年 1 月 27 日拍摄的 Nvidia 和 DeepSeek 徽标。 REUTERS - Dado Ruvic

作为中美地缘政治斗争中心的芯片制造商,英伟达最近同意向美国政府提供其在华收入的一部分,以恢复其 H20 芯片在中国的销售。英伟达在谈到使用其芯片的中国企业时表示:“开发者将在构建制胜的人工智能生态系统中发挥关键作用。放弃整个市场和开发者只会损害美国的经济和国家安全。”

DeepSeek 和华为尚未回应置评请求。

(0)
当前新闻共有0条评论 分享到:
评论前需要先 登录 或者 注册
全部评论
暂无评论
查看更多
实用资讯
24小时新闻排行榜
黄岩岛填岛效果图
首次曝光!中国展示缴获印度英萨斯步枪
3点疑问,比中国海警撞船本身更重要
10万艘渔船驶向南海之际 马科斯又有大动作
传习退位已定 时间表曝光
48小时新闻排行榜
黄岩岛填岛效果图
首次曝光!中国展示缴获印度英萨斯步枪
3点疑问,比中国海警撞船本身更重要
10万艘渔船驶向南海之际 马科斯又有大动作
传习退位已定 时间表曝光
DNA测试揭秘:乱伦现象远超想象
霹雳-17空空导弹 已成建制装备“三剑客”
真凉了!马兴瑞新职务曝光
抗中杀手锏 美军Mako极音速导弹出世
056护卫舰跑得慢、自持力差 遭嫌弃?
热门专题
1中美对抗2以哈战争3乌克兰战争
4美国大选5李克强猝逝6新冠疫情
7香港局势8委内瑞拉9华为
10黑心疫苗11“低端人群”12美国税改
13红黄蓝幼儿园14中共19大15郭文贵
广告服务 | 联系我们 | 关于我们 | 网站导航 | 隐私保护
Jobs. Contact us. Privacy Policy. Copyright (C) 1998-2025. Wforum.COM. All Rights Reserved.