Kimi-K2开源大模型上线一周登顶全球开源榜

🤖 由 文心大模型 生成的文章摘要

日前,北京月之暗面科技有限公司发布的开源大模型Kimi-K2,上线一周后便接棒DeepSeek,登顶国际权威大模型排行榜LMArena全球开源模型榜单,并在开闭源总榜上排名第五。

据了解,Kimi-K2在多项基准性能测试中取得优异表现,展现出在自主编程、智能体工具调用和数学推理等方面的领先能力。良好的使用体验也让Kimi-K2在海外技术社区收获大量好评。英国《自然》杂志网站评价,中国人工智能模型Kimi-K2发布后引发轰动,世界迎来“又一个DeepSeek时刻”。

“一方面,Kimi-K2的前端编程能力很强,在3D、游戏、动画制作等场景中,用简单的指令和Kimi-K2交互,就能得到很惊艳的效果。另一方面,智能体(Agent)的工具调动能力也让模型整体有了很大提升。”Kimi-K2项目组成员詹皓冰说。更通人性、更加实用、更加强大,也是Kimi-K2登顶全球榜单的优势所在。

据悉,Kimi-K2参数总规模达到万亿级别,但激活参数只有320亿。这意味着,Kimi-K2能以更低的成本开展更加复杂的工作。“我们提出了一些非常创新的方法,在有限的数据中,让模型学到更多的智能。同时,我们把Kimi-K2权重和技术方案都开源了,希望通过开放共享推动全球相关技术发展。我们也真诚地认为,开源社区也会反馈给我们更多观点,让我们后续迭代模型变得更强。”Kimi研究员杜羽伦说。

值得一提的是,Kimi-K2目前已接入OpenRouter、Cline、VisualStudioCode等国际主流开发平台。Kimi团队成员刘少伟分享称,Kimi-K2继承了DeepSeek-V3的架构,并在后者基础上进行增加专家数量、减少注意力头数量等调整,最终实现了较强的性能。这也显示出,中国的开源模型已经形成良好生态,在互相借鉴中持续进步。

月之暗面成立于2023年4月,总部位于海淀区知春路。创始人杨植麟博士本科毕业于清华大学,是国内顶尖的AI研究者,被誉为“中国大模型90后第一人”。2024年,月之暗面因推出了具备长文本分析和AI搜索功能的Kimi模型而迅速走红,吸引了大量用户关注。

「93913原创内容,转载请注明出处」