月之暗面或因DeepSeek调整工作重心,强化学习成关注焦点
创始人
2026-03-23 15:28:36
2月15日消息,据悉,月之暗面内部已将“持续拿到SOTA结果”确定为最重要的工作目标。2025年,他们计划在模型能力方向上加强多模态和长文本推理能力。然而,DeepSeek的成功让外界重新审视了月之暗面的技术和用户增长模式。两者在闭源与开源、预训练与蒸馏技术等方面存在差异。虽然尚未明确是否接入DeepSeek或开源,但有业内人士透露可能会将强化学习作为一个工作重点方向。此举被认为是对抗DeepSeek等竞争对手的一种改变或尝试。 近日OpenAI发布研究论文报告《Competitive Programming with Large Reasoning Models》,提到中国的DeepSeek-R1和Kimi k1.5利用思维链学习方法,在数学解题与编程挑战中表现出色。这也进一步引发了对于强化学习路线带来的模型能力提升的关注。

相关内容

热门资讯

南北冷暖逆转明起上演,下周中东... 2月15日消息,17日开始,受冷空气和新一轮降水共同影响,中东部大部气温将陆续转为偏低,尤其江淮、江...
字节CEO反思DeepSeek... 2月15日消息,字节跳动内部2月13日上午举办新一期全员会,字节跳动CEO梁汝波、电商业务负责人康泽...
月之暗面或因DeepSeek调... 2月15日消息,据悉,月之暗面内部已将“持续拿到SOTA结果”确定为最重要的工作目标。2025年,他...
《哪吒2》成为31个省份影史票... 2月15日消息,根据猫眼专业版数据梳理发现,截至2月15日18时45分,31个省份影史票房冠军均为《...
超15亿元收海外细分龙头公司,... 1月13日晚间,毕得医药(688073.SH)发布公告称,公司拟获得海外药物分子砌块企业Combi-...