DeepSeek新版R1直追OpenAI o3,实测表现惊艳

在端午节前夕,DeepSeek发布了新版R1模型DeepSeek-R1-0528,这次看似小版本的更新,却带来了诸多亮眼的表现,甚至在LiveCodeBench上几乎与OpenAI o3-high相当,引发了网友们的惊呼和热议。
新版R1在多个方面的更新亮点如下:‘
DeepSeek新版R1直追OpenAI o3,实测表现惊艳

DeepSeek新版R1直追OpenAI o3,实测表现惊艳

  • 推理能力:能够像Google模型一样进行深入推理,展现出独特的推理风格,既快速又深思熟虑。在长时间思考方面,每个任务最长能思考30-60分钟,这使其在解决复杂问题时能够更充分地进行思考和分析。
  • 写作任务改进:写作能力得到优化,生成的文本更自然、格式更好,这使得其在文本创作任务中的表现更加出色。
  • 编程能力提升:新版R1的编程能力显著增强。在实测中,能够快速理清设计思路,完成诸如用Three.js模拟太阳系等编程任务,并且生成的效果包含动画、交互以及光影效果,展现了强大的编程实力。
  • 前端设计功底:在结合论文设计网页的测试中,展现了不俗的前端设计能力,能够根据给定的论文设计出介绍R1的网页,这表明其在处理涉及设计和布局的任务时也有着出色的表现。
在实测中,新版R1还展现了一些有趣的特点。例如在解决“让7米长的甘蔗通过2米高1米宽的门”这道经典题时,它思考了足足151秒,并给出了可执行的方案。在思考过程中,它还会考虑答案对提问者而言是否有趣,甚至试图用幽默的方式来应对难题。
此次更新的新版R1模型已经在HuggingFace上释出,依然采用MIT协议,这对于开源社区来说是一大利好消息,也为开源模型与闭源模型的竞争注入了新的活力。
总的来说,DeepSeek新版R1的更新虽然名为“小版本升级”,但实际上在多个方面都有着显著的提升和优化,其在实测中的表现也证明了这是一次不容小觑的更新。随着更多的测试和应用场景的挖掘,DeepSeek R1-0528有望在AI领域发挥更大的作用,并为开源模型的发展树立新的标杆。
版权声明:AI工具箱导航 发表于 2025-05-29 12:56:15。
转载请务必标明出处:DeepSeek新版R1直追OpenAI o3,实测表现惊艳 | AI工具箱导航