MiniMax发布新一代Agent大模型M2.7 首次实现模型自我进化

🤖 由 文心大模型 生成的文章摘要

国内AI企业MiniMax正式发布新一代Agent旗舰大模型M2.7,该模型首次对外展示了 “模型自我进化”的技术路径,通过创新的技术体系让模型深度参与自身训练优化,成为 AI 大模型向自主化、高效化发展的重要突破。

据了解,M2.7的核心突破在于构建了Agent Harness体系,这一体系让模型能够深度参与到自身的训练与优化全流程中。在MiniMax内部的研发场景测试中,M2.7可承担30%-50%的研发工作量,大幅提升AI模型的研发效率;同时在内部评测集上,该模型实现了约 30% 的效果提升,模型性能得到显著优化。

在核心能力的权威评测中,M2.7交出了亮眼答卷。软件工程能力方面,模型在SWE-bench Pro 评测中取得56.22%的成绩,展现出强劲的代码开发与工程问题解决能力;在VIBE-Pro、Terminal Bench 2等聚焦真实工程场景的测试中,M2.7能够支持端到端的项目交付,同时具备复杂系统的理解与处理能力,适配实际工业生产中的工程需求。

办公生产力场景是M2.7的另一大优势领域。该模型在GDPval-AA评测中获得1495的ELO得分,这一成绩为当前开源模型中的最高值。同时,M2.7大幅提升了Office文档处理能力与多轮编辑能力,能够更好地适配日常办公中的各类文档处理、内容编辑需求,为办公场景的智能化升级提供了有力支撑。

MiniMax此次发布的M2.7大模型,凭借模型自我进化的技术路径与多场景的优异表现,进一步丰富了Agent大模型的应用落地能力,也为AI大模型从“技术研发”向“实际落地”的转化提供了新的思路。

「93913原创内容,转载请注明出处」