DeepSeek新版R1直追OpenAI o3，实测表现惊艳

AI快讯 3天前 AI工具箱导航

0 0

在端午节前夕，DeepSeek发布了新版R1模型DeepSeek-R1-0528，这次看似小版本的更新，却带来了诸多亮眼的表现，甚至在LiveCodeBench上几乎与OpenAI o3-high相当，引发了网友们的惊呼和热议。

新版R1在多个方面的更新亮点如下：‘

推理能力：能够像Google模型一样进行深入推理，展现出独特的推理风格，既快速又深思熟虑。在长时间思考方面，每个任务最长能思考30-60分钟，这使其在解决复杂问题时能够更充分地进行思考和分析。
写作任务改进：写作能力得到优化，生成的文本更自然、格式更好，这使得其在文本创作任务中的表现更加出色。
编程能力提升：新版R1的编程能力显著增强。在实测中，能够快速理清设计思路，完成诸如用Three.js模拟太阳系等编程任务，并且生成的效果包含动画、交互以及光影效果，展现了强大的编程实力。
前端设计功底：在结合论文设计网页的测试中，展现了不俗的前端设计能力，能够根据给定的论文设计出介绍R1的网页，这表明其在处理涉及设计和布局的任务时也有着出色的表现。

在实测中，新版R1还展现了一些有趣的特点。例如在解决“让7米长的甘蔗通过2米高1米宽的门”这道经典题时，它思考了足足151秒，并给出了可执行的方案。在思考过程中，它还会考虑答案对提问者而言是否有趣，甚至试图用幽默的方式来应对难题。

此次更新的新版R1模型已经在HuggingFace上释出，依然采用MIT协议，这对于开源社区来说是一大利好消息，也为开源模型与闭源模型的竞争注入了新的活力。

总的来说，DeepSeek新版R1的更新虽然名为“小版本升级”，但实际上在多个方面都有着显著的提升和优化，其在实测中的表现也证明了这是一次不容小觑的更新。随着更多的测试和应用场景的挖掘，DeepSeek R1-0528有望在AI领域发挥更大的作用，并为开源模型的发展树立新的标杆。

版权声明：AI工具箱导航发表于 2025-05-29 12:56:15。
转载请务必标明出处：DeepSeek新版R1直追OpenAI o3，实测表现惊艳 | AI工具箱导航