中国团队攻克AI几何推理难题通矩模型实现“解题+出题”双重突破

🤖 由文心大模型生成的文章摘要

国际顶级学术期刊《自然·机器智能》在线发表了一项重磅成果：由北京通用人工智能研究院联合北京大学多学院组成的中国科研团队，成功研发出全球首个兼具自主出题与自动解题能力的通用AI系统——通矩模型（TongGeometry）。这一突破不仅实现了几何推理领域关键技术的自主可控，更标志着我国在通用人工智能逻辑推理核心领域迈入国际领先行列，完成了从“模仿解题”到“自主创造”的范式革新。

在人工智能领域，国际数学奥林匹克竞赛（IMO）一直被视为衡量机器逻辑思维与空间想象力的“终极考场”，其中平面几何问题因融合数值精度与空间直觉，更被公认为自动化推理的“最后堡垒”。长期以来，AI攻克这一堡垒面临两大核心难题：一是“组合爆炸”，几何推理中辅助线的添加会使搜索空间呈指数级增长，传统算法极易陷入无效尝试；二是“高质量数据匮乏”，优质几何题库规模有限，难以支撑大规模模型训练。2024年初，DeepMind推出的AlphaGeometry虽在解题能力上取得进展，但仍依赖海量离线合成数据与昂贵算力集群，本质上只是“被动解题者”。

中国科研团队另辟蹊径，走出了一条“小数据、大任务”的原创路径。通矩模型的核心突破在于创新性引入“规范化表示”技术，赋予AI穿透图形表象的“透视能力”——无论几何图形经过旋转、翻转还是缩放，系统都能精准锁定本质几何关系，将指数级增长的搜索空间压缩数个数量级，从根源上破解了“组合爆炸”难题。更具革命性的是，模型内置“价值函数”模拟人类数学家的审美直觉，通过强化学习实时预判推理路径的潜力，不仅追求结论正确，更注重推导过程的简洁优美。

“当一个几何命题的证明难度显著高于其构建复杂度时，它便具备了作为奥赛题目的‘审美价值’。”论文第一作者、北京通用人工智能研究院研究员张驰解释道，这种“价值引导”让通矩模型从浩如烟海的空间组合中，精准筛选出符合人类数学审美标准的优质题目，真正实现了从机械计算到智能创造的跨越。在性能测试中，该模型展现出极高的效率优势：仅需一张普通消费级显卡（如RTX 4090），即可在最多38分钟内解决2000年以来所有IMO几何难题，推理准确率与效率均达到世界顶尖水平，大幅超越依赖算力集群的国际同类系统。

模型的原创能力已通过权威场景验证。其自主生成的3道几何新题，成功入选2024年全国中学生数学联赛（北京赛区）及美国精英奥赛（Ersatz Math Olympiad）题库，成为全球范围内AI原创题目首次登上高规格人类数学竞赛舞台的案例。参赛学生反馈，AI出的题目思路新颖独特，需跳出常规思维框架；奥数评委亦评价，这些题目逻辑严谨、设计优美，完全符合竞赛对区分度和创新性的要求，“看不出是AI的作品”。

「93913原创内容，转载请注明出处」

中国团队攻克AI几何推理难题通矩模型实现“解题+出题”双重突破

相关文章

Meta拟对Scale AI进行巨额投资，推动AI领域新变革

谷歌推出首个基于人工智能的Android更新和新款Pixel 9手机

VAST斩获近2亿美元系列融资并发布Project Eden世界模型，开辟世界模型解耦技术新路线

华为云表示亚太地区是其人工智能产品的巨大市场

AI智能体迎爆发式增长 2030年全球规模将达22亿个

字节跳动开源Deep Research项目DeerFlow，革新内容生成与研究方式

推荐

剑指AR眼镜！JBD合肥Micro-LED二期提前62天开工，加码全彩微显示研发

尼卡光学完成近亿元A轮融资全球首条百万片级体全息光波导产线投产

AI眼镜行业爆发前夜：业绩与资本双热，产业链步入“快车道”

三星Galaxy Glasses重磅来袭：联手谷歌打造AI穿戴新标杆

AI应用推荐

热门

剑指AR眼镜！JBD合肥Micro-LED二期提前62天开工，加码全彩微显示研发

尼卡光学完成近亿元A轮融资全球首条百万片级体全息光波导产线投产

友情链接

推荐

剑指AR眼镜！JBD合肥Micro-LED二期提前62天开工，加码全彩微显示研发

尼卡光学完成近亿元A轮融资全球首条百万片级体全息光波导产线投产

AI眼镜行业爆发前夜：业绩与资本双热，产业链步入“快车道”

三星Galaxy Glasses重磅来袭：联手谷歌打造AI穿戴新标杆