梁文锋DeepSeek论文登上《自然》封面 | |
www.wforum.com | 2025-09-17 22:10:51 联合早报 | 0条评论 | 查看/发表评论![]() |
![]() |
![]() |
|
|
|
中国人工智能公司深度求索(DeepSeek)创始人梁文锋有关DeepSeek-R1大语言模型的论文,登上了学术期刊《自然》(Nature)的封面。 据《科技日报》报道,梁文锋及DeepSeek团队星期三(9月17日)在《自然》封面发表了开源人工智能(AI)模型DeepSeek-R1所采用的大规模推理模型训练方法。 梁文锋团队报告称,模型使用了强化学习而非人类示例来开发推理步骤,减少了训练成本和复杂性。DeepSeek-R1在被展示优质的问题解决案例后,会获得一个模板来产生推理过程,这一模型通过解决问题获得奖励,从而强化学习效果。 团队总结说,未来研究可以聚焦优化奖励过程,以确保推理和任务结果更可靠。 《自然》在社论中称,目前没有任何一种主流大型语言模型在学术期刊中经历过独立的同行评审,这一状况随着《自然》杂志发表有关R1模型的详细信息而发生变化。 社论称,R1模型已经过八名专家评审,评估了原创性、方法论和稳健性,并呼吁其他公司效仿DeepSeek的做法。“在一个未经证实的言论和炒作屡见不鲜的行业中,所有这些都是朝着透明度和可重复性迈出的可喜一步。” |
|
|
|
![]() |
24小时新闻排行榜
![]() |
在航空发动机赛道,中国位居第几? |
![]() |
乌军被惊呆!俄军掉头直奔第聂伯罗 |
![]() |
伊朗押注歼-10 或将重塑中东空中力量平衡 |
![]() |
印官员:“阵风”表现出色,击败了中国导弹 |
![]() |
以军如入无人之境 “内鬼”竟然是阵风? |
48小时新闻排行榜
![]() |
在航空发动机赛道,中国位居第几? |
![]() |
乌军被惊呆!俄军掉头直奔第聂伯罗 |
![]() |
伊朗押注歼-10 或将重塑中东空中力量平衡 |
![]() |
印官员:“阵风”表现出色,击败了中国导弹 |
![]() |
以军如入无人之境 “内鬼”竟然是阵风? |
![]() |
俄罗斯:美国为中国准备了25个秘密武器 |
![]() |
印度第4代坦克太奇葩:竟然搭载4个乘员 |
![]() |
于朦胧案牵扯两高官 传一人是蔡奇私生子 |
![]() |
普京宣布暂停和谈 欧洲局势骤然升级 |
![]() |
毛新宇在装傻?原来背后有高人指点 |