揭DeepSeek高效内幕辉达亲授“神速训练”秘诀-时事新闻-世界论坛网（电脑版）

首页

即时

热点

图片

论坛

简体/繁体 | 广告服务 | 联系我们 | 关于我们 |

世界论坛网 > 时事新闻 > 正文

揭DeepSeek高效内幕辉达亲授“神速训练”秘诀
www.wforum.com \| 2026-01-31 18:35:54 身边 \| 0条评论 \| 查看/发表评论




中国的人工智慧“深度求索”去年初主打低推出成本、高效能的人工智慧（AI）模型。如今，美国国会揭露文件指出，这项“高效率突破”背后，曾获得美国芯片大厂辉达在2024年提供大量技术协助，改善其AI模型，而这些模型后来被中国军方使用。中国的人工智慧（AI）公司“深度求索”（DeepSeek）去年初推出低成本、高效能AI模型，其表现甚至可与美国一些最顶尖的产品一较高下，引发市场震荡。华府对此相当担忧，认为就算当局已限制把高效能运算芯片卖给中国，中国人可能在AI领域赶上美国。辉达2024年提供技术支援　DeepSeek训练效率大增然而，路透社28日看到一封写给美国商务部长卢特尼克（Howard Lutnick）的信件，其中密歇根州共和党众议员、联邦众议院美国与中国共产党战略竞争特别委员会主席穆勒纳尔（John Moolenaar）表示，该委员会从辉达取得该公司2024年相关活动的文件显示，DeepSeek这项成果是在辉达提供大量技术协助后才达成。穆伦纳尔在信中写道，“根据辉达的内部纪录，辉达的技术研发人员透过『演算法、框架和硬体的最佳化协同设计』，大幅提升DeepSeek的训练效率。辉达内部报告甚至自豪地（boasting）指出，『DeepSeek完整训练仅需278.8万个H800 GPU小时（GPU Hours）运算时间』，这低于美国开发者在打造前沿级模型（frontier-scale models）时通常所需的运算量。” 所谓GPU小时（GPU hours）指的是训练一个人工智慧模型时，AI芯片必须运作的总时数，其公式为：执行小时数×GPU数，举例来说，5张芯片跑了6个小时，那就是30个GPU小时。至于前沿级模型，则是指由美国企业推出的顶尖模型，例如OpenAI、Anthropic，或Alphabet旗下的Google所开发的模型。穆伦纳尔写道，当时辉达向DeepSeek提供协助时，外界并没有任何公开迹象显示DeepSeek的技术会被中国军方使用，“因此，辉达是以正常方式对待DeepSeek，将之视为一个合法的商业伙伴，来提供标准的技术支援。”

当前新闻共有0条评论	分享到：

评论前需要先登录或者注册哦

全部评论

暂无评论

	实用资讯

24小时新闻排行榜

	印度前陆军一号“反水”：阿克赛钦换藏南
	俄军羡慕！中国空警-3000就是“世界最强”
	开战66天战火重燃美伊海战全面打响
	重金升级F16，巴铁为什么不增购歼10？
	史无前例！乌克兰机器人组团开赴前线

48小时新闻排行榜

	印度前陆军一号“反水”：阿克赛钦换藏南
	俄军羡慕！中国空警-3000就是“世界最强”
	开战66天战火重燃美伊海战全面打响
	重金升级F16，巴铁为什么不增购歼10？
	史无前例！乌克兰机器人组团开赴前线
	12枚导弹被成功拦截阿联酋可高枕无忧？
	155毫米舰炮打得远，打得准吗？
	爆中共空军悄悄大洗牌
	温家宝提方案习近平面临历史大抉择
	乌克兰宣布停火这是怕了还是想害普京？

热门专题

1	中美对抗	2	以哈战争	3	乌克兰战争
4	美国大选	5	李克强猝逝	6	新冠疫情
7	香港局势	8	委内瑞拉	9	华为
10	黑心疫苗	11	“低端人群”	12	美国税改
13	红黄蓝幼儿园	14	中共19大	15	郭文贵

广告服务 | 联系我们 | 关于我们 | 网站导航 | 隐私保护

Jobs. Contact us. Privacy Policy. Copyright (C) 1998-2026. Wforum.COM. All Rights Reserved.