DeepSeek新模型因使用华为芯片难产？-时事新闻-世界论坛网（电脑版）

首页

即时

热点

图片

论坛

简体/繁体 | 广告服务 | 联系我们 | 关于我们 |

世界论坛网 > 时事新闻 > 正文

DeepSeek新模型因使用华为芯片难产？
www.wforum.com \| 2025-08-14 07:44:28 RFI \| 0条评论 \| 查看/发表评论




中国人工智能公司 DeepSeek 因使用华为昇腾系列芯片进行训练受挫而推迟了其第二代模型的发布，凸显了中国政府力推取代美国技术的局限性。《金融时报》报道引述据三位知情人士透露，DeepSeek 在 1 月份发布其 R1模型后，受到当局的鼓励，采用华为，而不是使用英伟达的处理器。但知情人士表示，这家中国初创公司在使用华为昇腾系列Ascend 芯片进行 R2 模型训练的过程中遇到了持续的技术问题，促使其使用英伟达芯片进行训练，使用华为芯片进行推理。一位知情人士表示，这些问题是该模型发布日期从 5 月推迟的主要原因，导致其落后于竞争对手。训练是指模型从大型数据集中学习，而推理是指使用训练好的模型进行预测或生成响应(例如聊天机器人的查询)的步骤。《金融时报》分析指出，DeepSeek 的困境表明，中国芯片在关键任务上仍落后于美国竞争对手，凸显了中国在技术自给自足方面面临的挑战。有报道称，中国政府已要求中国科技公司解释其订购英伟达H20芯片的合理性，以鼓励它们推广华为和寒武纪的替代产品。业内人士表示，与英伟达的产品相比，中国芯片存在稳定性问题、芯片间连接速度较慢以及软件质量较差等问题。据两位知情人士透露，华为派了一个工程师团队前往 DeepSeek 的办公室，帮助该公司使用其 AI 芯片开发 R2 模型。然而，尽管团队在现场，DeepSeek 仍无法在昇腾芯片上成功进行训练。知情人士表示，DeepSeek仍在与华为合作，以使该模型与昇腾芯片兼容进行推理。 DeepSeek创始人梁文锋内部曾表示，他对R2的进展不满意，并一直在努力投入更多时间构建更先进的模型，以保持公司在人工智能领域的领先地位。另一位知情人士补充说，R2 的发布也因更新模型的数据标注时间长于预期而被推迟。中国媒体报道称，该模型最早可能在未来几周内发布。作为中美地缘政治斗争中心的芯片制造商，英伟达最近同意向美国政府提供其在华收入的一部分，以恢复其 H20 芯片在中国的销售。英伟达在谈到使用其芯片的中国企业时表示：“开发者将在构建制胜的人工智能生态系统中发挥关键作用。放弃整个市场和开发者只会损害美国的经济和国家安全。” DeepSeek 和华为尚未回应置评请求。

当前新闻共有0条评论	分享到：

评论前需要先登录或者注册哦

全部评论

暂无评论

	实用资讯

24小时新闻排行榜

	全球唯一空射核弹：超音速射程8000公里
	乌克兰应体面止损历史不会为政治表演颁奖
	突发！川普：习近平已经同意了
	中方对日打法有变川普急电高市早苗交底
	堪称奇迹！歼-50驯服兰姆达翼固有缺陷

48小时新闻排行榜

	全球唯一空射核弹：超音速射程8000公里
	乌克兰应体面止损历史不会为政治表演颁奖
	突发！川普：习近平已经同意了
	中方对日打法有变川普急电高市早苗交底
	堪称奇迹！歼-50驯服兰姆达翼固有缺陷
	在琉球部署中程导弹，日本这招险在哪儿？
	美军双航母接力打捞南海坠机，意味什么？
	美军下命令：日本有事就是美国有事
	中国六代机新样机使用矢量喷口
	快讯！军方宣布：已全面掌控国家总统被捕

热门专题

1	中美对抗	2	以哈战争	3	乌克兰战争
4	美国大选	5	李克强猝逝	6	新冠疫情
7	香港局势	8	委内瑞拉	9	华为
10	黑心疫苗	11	“低端人群”	12	美国税改
13	红黄蓝幼儿园	14	中共19大	15	郭文贵

广告服务 | 联系我们 | 关于我们 | 网站导航 | 隐私保护

Jobs. Contact us. Privacy Policy. Copyright (C) 1998-2025. Wforum.COM. All Rights Reserved.