
在人工智能领域围绕人工通用智能(AGI)的争论陷入定义模糊的僵局之际,图灵奖得主、被誉为“AI教父”的约书亚・本吉奥领衔全球顶尖研究团队,于10月16日发表重磅论文《ADefinitionofAGI》,首次为这一抽象概念提供了可衡量的清晰界定与系统化评估框架,为行业发展指明了明确方向。
长期以来,AGI始终笼罩在“类人智能”的模糊表述中,不同阵营对其内涵与实现路径各执一词。以OpenAI、Google为代表的企业界坚信当前大模型的扩展定律能通向AGI,而强化学习之父Richard Sutton、图灵奖得主YannLe Cun等学术界巨擘则对现有技术路线提出尖锐批评。这场争论难以定论的核心症结,在于AGI缺乏统一的定义标准与评估体系。本吉奥团队的研究正是为破解这一困境而生,其组建的27人研究团队堪称“豪华天团”,涵盖AI安全、伦理领域的顶尖学者、跨学科专家、行业领袖及知名思想家,包括AI安全中心主任Dan Hendrycks、加州大学伯克利分校顶尖专家Dawn Song、未来生命研究所创始人Max Tegmark等,强大的阵容确保了研究的权威性与全面性。
论文创新性地将AGI明确定义为“在认知通用性和熟练度上能达到或超过受过良好教育成年人水平的人工智能”,这一定义通过双重维度破解了此前的概念模糊难题。在参照系层面,直接锚定“受过良好教育的成年人”,摒弃了“超人类智能”等抽象表述,为实际评估提供了具体标尺;在能力要求上,强调认知的全面性,拒绝单一任务的极致表现,要求系统在多个核心认知领域均衡发展,避免严重“偏科”。其中,通用性(广度)与熟练度(深度)构成AGI的两大核心特质,前者要求覆盖广泛认知领域,后者则规定各领域能力需达到成人专业水准,排除了仅能完成表面任务的系统。
为将定义落地为可操作的评估体系,研究团队引入了心理测量学界公认的Cattell-Horn-Carroll(CHC)理论。这一经过近百年验证的人类智力结构模型,通过对海量认知测试数据的分析,构建了包含三层级的金字塔结构,其核心的十大广义能力覆盖了从基础感知到高阶推理的完整认知链条。研究团队基于该理论,对人类传统认知测试题进行AI适配改造,剔除依赖生理感知和特定场景的题目,最终形成包含500余道题目的AGI评估题库,将AGI能力明确划分为十大方向:
通用知识(K)聚焦常识、自然科学、社会科学等领域的知识储备;读写能力(RW)涵盖文本理解、语言表达与文字创作等技能;数学能力(M)涉及计算、定量推理及数字概念掌握;即时推理(R)考验新颖问题处理与抽象思维能力;工作记忆(WM)衡量短期信息的保持与加工效率;记忆存储(MS)评估信息长期稳定存储能力;长期记忆检索(MR)考查知识提取的精准度;视觉处理(V)包括图像识别与空间信息解读等功能;听觉处理(A)涉及声音识别与语音理解等能力;速度(S)则评估简单认知任务的处理效率。








