世界论坛网 > 时事新闻 > 正文  
揭DeepSeek高效内幕 辉达亲授“神速训练”秘诀
www.wforum.com | 2026-01-31 18:35:54  身边 | 0条评论 | 查看/发表评论

中国的人工智慧“深度求索”去年初主打低推出成本、高效能的人工智慧(AI)模型。如今,美国国会揭露文件指出,这项“高效率突破”背后,曾获得美国芯片大厂辉达在2024年提供大量技术协助,改善其AI模型,而这些模型后来被中国军方使用。

中国的人工智慧(AI)公司“深度求索”(DeepSeek)去年初推出低成本、高效能AI模型,其表现甚至可与美国一些最顶尖的产品一较高下,引发市场震荡。华府对此相当担忧,认为就算当局已限制把高效能运算芯片卖给中国,中国人可能在AI领域赶上美国。

辉达2024年提供技术支援 DeepSeek训练效率大增

然而,路透社28日看到一封写给美国商务部长卢特尼克(Howard Lutnick)的信件,其中密歇根州共和党众议员、联邦众议院美国与中国共产党战略竞争特别委员会主席穆勒纳尔(John Moolenaar)表示,该委员会从辉达取得该公司2024年相关活动的文件显示,DeepSeek这项成果是在辉达提供大量技术协助后才达成。

穆伦纳尔在信中写道,“根据辉达的内部纪录,辉达的技术研发人员透过『演算法、框架和硬体的最佳化协同设计』,大幅提升DeepSeek的训练效率。辉达内部报告甚至自豪地(boasting)指出,『DeepSeek完整训练仅需278.8万个H800 GPU小时(GPU Hours)运算时间』,这低于美国开发者在打造前沿级模型(frontier-scale models)时通常所需的运算量。”

英伟达股价在2023年还能通过人工智概念继续上涨吗?__财经头条

所谓GPU小时(GPU hours)指的是训练一个人工智慧模型时,AI芯片必须运作的总时数,其公式为:执行小时数×GPU数,举例来说,5张芯片跑了6个小时,那就是30个GPU小时。至于前沿级模型,则是指由美国企业推出的顶尖模型,例如OpenAI、Anthropic,或Alphabet旗下的Google所开发的模型。

穆伦纳尔写道,当时辉达向DeepSeek提供协助时,外界并没有任何公开迹象显示DeepSeek的技术会被中国军方使用,“因此,辉达是以正常方式对待DeepSeek,将之视为一个合法的商业伙伴,来提供标准的技术支援。”

(0)
当前新闻共有0条评论 分享到:
评论前需要先 登录 或者 注册
全部评论
暂无评论
查看更多
实用资讯
24小时新闻排行榜
55万大军生死突围 让印度感到“代差”恐惧
电线杆导弹,中国PL17真的存在
解放军原副总参谋长已死半个月 现在才公开
中国004航母快完工 六代机会上舰?
中国最著名“叛国者”终被允许回国
48小时新闻排行榜
55万大军生死突围 让印度感到“代差”恐惧
电线杆导弹,中国PL17真的存在
解放军原副总参谋长已死半个月 现在才公开
中国004航母快完工 六代机会上舰?
中国最著名“叛国者”终被允许回国
中国歼轰7,为何这么多年都没卖出去1架?
2000艘中国渔船排成一条470公里惊人长阵
罕见信号!张又侠亲属集体撤离北京
伊朗有一张王牌:它是拿捏世界的“咽喉开关
完全体歼-20开始量产 魔改型五年内可能问世
热门专题
1中美对抗2以哈战争3乌克兰战争
4美国大选5李克强猝逝6新冠疫情
7香港局势8委内瑞拉9华为
10黑心疫苗11“低端人群”12美国税改
13红黄蓝幼儿园14中共19大15郭文贵
广告服务 | 联系我们 | 关于我们 | 网站导航 | 隐私保护
Jobs. Contact us. Privacy Policy. Copyright (C) 1998-2026. Wforum.COM. All Rights Reserved.