DeepSeek新模型因使用华为芯片难产? | |
www.wforum.com | 2025-08-14 07:44:28 RFI | 0条评论 | 查看/发表评论![]() |
![]() |
![]() |
|
|
|
中国人工智能公司 DeepSeek 因使用华为昇腾系列芯片进行训练受挫而推迟了其第二代模型的发布,凸显了中国政府力推取代美国技术的局限性。 《金融时报》报道引述据三位知情人士透露,DeepSeek 在 1 月份发布其 R1模型后,受到当局的鼓励,采用华为 ,而不是使用英伟达的处理器。但知情人士表示,这家中国初创公司在使用 华为昇腾系列Ascend 芯片进行 R2 模型训练的过程中遇到了持续的技术问题,促使其使用英伟达芯片进行训练,使用华为芯片进行推理。 一位知情人士表示,这些问题是该模型发布日期从 5 月推迟的主要原因,导致其落后于竞争对手。 训练是指模型从大型数据集中学习,而推理是指使用训练好的模型进行预测或生成响应(例如聊天机器人的查询)的步骤。 《金融时报》分析指出,DeepSeek 的困境表明,中国芯片在关键任务上仍落后于美国竞争对手,凸显了中国在技术自给自足方面面临的挑战。 有报道称,中国政府已要求中国科技公司解释其订购英伟达H20芯片的合理性,以鼓励它们推广华为和寒武纪的替代产品。业内人士表示,与英伟达的产品相比,中国芯片存在稳定性问题、芯片间连接速度较慢以及软件质量较差等问题。 据两位知情人士透露,华为派了一个工程师团队前往 DeepSeek 的办公室,帮助该公司使用其 AI 芯片开发 R2 模型。然而,尽管团队在现场,DeepSeek 仍无法在昇腾芯片上成功进行训练。 知情人士表示,DeepSeek仍在与华为合作,以使该模型与昇腾芯片兼容进行推理。 DeepSeek创始人梁文锋内部曾表示,他对R2的进展不满意,并一直在努力投入更多时间构建更先进的模型,以保持公司在人工智能领域的领先地位。 另一位知情人士补充说,R2 的发布也因更新模型的数据标注时间长于预期而被推迟。中国媒体报道称,该模型最早可能在未来几周内发布。 图为 2025 年 1 月 27 日拍摄的 Nvidia 和 DeepSeek 徽标。 REUTERS - Dado Ruvic 作为中美地缘政治斗争中心的芯片制造商,英伟达最近同意向美国政府提供其在华收入的一部分,以恢复其 H20 芯片在中国的销售。英伟达在谈到使用其芯片的中国企业时表示:“开发者将在构建制胜的人工智能生态系统中发挥关键作用。放弃整个市场和开发者只会损害美国的经济和国家安全。” DeepSeek 和华为尚未回应置评请求。 |
|
|
|
![]() |