DeepSeek R1模型完成小版本试升级,全新模型DeepSeek-R1-0528-Qwen3-8B发布

🤖 由 文心大模型 生成的文章摘要

DeepSeek官方宣布DeepSeek R1模型已完成小版本试升级,用户可前往官方网页、APP、小程序测试,API接口和使用方式保持不变。此次升级基于2024年12月发布的DeepSeek V3-0324模型进行后训练,模型参数达到685B。在提升计算资源配置的同时,DeepSeek在后续训练中引入算法优化机制,显著提升了模型的推理能力。​

在数学、编程与通用逻辑等多个基准测评中,DeepSeekR1-0528取得了国内所有模型中的优异成绩,整体表现接近国际顶尖模型如o3与Gemini-2.5-Pro。相较于旧版R1,新版模型在复杂推理任务中的表现有了显著提升。例如,在AIME 2025测试中,新版模型准确率从70%提升至87.5%。这一进步得益于模型在推理过程中的思维深度增强:在AIME 2025测试集上,旧版模型平均每题使用12Ktokens,而新版模型平均每题使用23Ktokens,表明其在解题过程中进行了更为详尽和深入的思考。​

此外,DeepSeek团队还通过蒸馏DeepSeek-R1-0528的思维链(Chain-of-Thought),对Qwen3-8BBase进行后训练,得到了全新模型DeepSeek-R1-0528-Qwen3-8B。该模型在AIME 2024测试中达到了开源模型中的最新SOTA(最先进)性能,较Qwen3-8B提升了10.0%,并与Qwen3-235B-thinking的表现相当。​

DeepSeek-R1-0528-Qwen3-8B在面对问题时,会展示完整的思考过程,并且从多个角度客观给出分析。这一特性使得该模型在处理复杂任务时,能够提供更全面、准确的解决方案。DeepSeek方面表示,相信DeepSeek-R1-0528的思维链对于学术界推理模型的研究和工业界针对小模型的开发都将具有重要意义。​

除了推理能力的提升,新版DeepSeek R1还针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45%-50%左右,能够更有效地提供准确可靠的结果。在创意写作方面,更新后的R1模型进一步优化了议论文、小说、散文等文体的输出,能够生成篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。​

此次DeepSeek R1模型的小版本试升级以及全新模型DeepSeek-R1-0528-Qwen3-8B的发布,展示了DeepSeek团队在模型优化和创新方面的持续努力,有望为AI领域带来新的发展动力。

「93913原创内容,转载请注明出处」