
蚂蚁集团百灵大模型团队正式发布Ling 2.0系列首款旗舰产品——万亿参数通用语言模型 Ling-1T,同步在Hugging Face与魔搭社区全面开源。这是继9月30日开源万亿参数思考模型Ring-1T-preview(获深度学习权威Yann LeCun点赞“Impressive”)后,蚂蚁在短短十天内推出的第二款万亿级模型,以 “四天一新品” 的迭代速度掀起开源热潮。
Ling-1T 的核心突破在于打破 “参数规模与推理效率不可兼得” 的行业困局,通过三大技术创新实现帕累托优化:
MoE智能激活架构:采用“万亿储备、百亿激活”的混合专家机制,总参数量达1万亿,但单次任务仅激活约500亿参数(激活比1/32),如同精准召集领域专家解题,兼顾深度与效率。
FP8混合精度训练:作为目前已知规模最大的FP8训练基座模型,实现15%以上端到端加速,显存占用降低30%,且在万亿token训练中精度损失偏差≤0.1%。
推理增强双技术:通过 “中训练 + 后训练” 的演进式思维链(Evo-CoT)激活推理潜能,搭配句子级 LPO 强化学习算法,使奖励信号与语义输出对齐精度提升27%。
权威测评显示,Ling-1T在多维度测试中展现 “高效且精准” 的核心优势:
数学推理登顶:在AIME 2025(AI奥数)基准中,以4000Token消耗实现70.42%准确率,超越Gemini-2.5-Pro(5000Token、70.10% 准确率),拓展帕累托最优边界。
代码生成领先:LiveCodeBench真实编程任务得分第一,ArtifactsBench复杂建模获开源模型榜首,生成代码兼顾功能正确性与视觉美感。
跨领域能力突出:金融推理(FinanceReasoning)达87.45分,C-Eval、MMLU等知识基准突破92分,工具调用准确率超70%。
蚂蚁将Ling-1T定位为“非思考模型”,与侧重深度推理的Ring系列形成互补,构建覆盖手机端(Ling-mini)、企业级(Ling-flash)、云端(Ling-1T)的全场景模型矩阵。更值得关注的是,蚂蚁同步开放ATorch框架、强化学习工具链等底层能力,使模型研发实现 “流水线化”,降低开发者门槛。








