首届国际通用人工智能大会聚焦AGI发展,腾讯、淘天展示技术成果

🤖 由 文心大模型 生成的文章摘要

5月24日至25日,首届国际通用人工智能大会在北京盛大举行,来自全球数十个国家和地区的近千位专家学者、技术领袖齐聚一堂。此次大会围绕通用人工智能(AGI)展开深入探讨,尤其关注大模型出现后距离实现真正AGI的差距,旨在通过深度思想碰撞构建原创性技术路线,打造具有国际影响力的AGI学术高地。​

大会开幕式上,北京通用人工智能研究院院长朱松纯教授提出了“基于哲学思想的CUV框架理论”,强调中国构建自主AGI技术体系的重要性。朱松纯教授指出,构建通用智能体需要赋予其自驱的价值和意义,智能的本质是价值驱动。他认为,当前人工智能发展面临诸多挑战,大模型虽然取得了显著进展,但距离实现通人工智能仍有很长的路要走。只有从根本上理解智能的价值驱动本质,才能为AGI的发展提供更坚实的理论基础。​

在此次大会上,腾讯混元模型矩阵全面升级成为一大亮点。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生介绍,混元旗舰快思考模型混元TurboS在全球公认的权威大语言模型评测平台ChatbotArena上,排名已攀升至全球前八,国内仅次于DeepSeek,其代码、数学等理科能力也进入全球前十。混元TurboS作为业界首款大规模混合Mamba-MoE模型,通过预训练阶段的tokens增训,以及后训练阶段引入长短思维链融合技术,使得理科推理提升超10%,代码能力提升24%,竞赛数学成绩大幅提升了39%。深度思考模型混元T1自年初上线元宝App后持续迭代,在竞赛数学、常识问答以及复杂任务的Agent能力等核心能力上均有显著提升。​

基于TurboS基座,腾讯还新推出了视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice。T1-Vision支持多图输入,具备原生长思维链,能实现“边看图边思考”,相比此前级联方案效果提升5.3%,理解速度提升50%。混元Voice实现了低延迟语音通话,相比级联方案响应速度提升超过30%,降至1.6秒,拟人性和情绪应用能力也明显提升,目前已在腾讯元宝App灰度上线。此外,混元图像2.0、混元3Dv2.5及混元游戏视觉生成等一系列多模态模型也同步“上新”。混元图像2.0率先实现“毫秒级”生图,GenEval基准测试准确率超95%。

混元3Dv2.5凭借业界首创的稀疏3D原生架构,实现了可控性与超高清生成能力的代际飞跃,几何模型精度提升10倍,纹理贴图达4K。混元游戏视觉生成模型涵盖游戏技能特效生成、角色动态立绘等五大子模型,相关平台也正式上线,大幅提升游戏美术设计效率。​

淘天集团也在大会上展示了多项最新AI技术成果。阿里妈妈首次在国内展示AIGR(生成式推荐)方面的最新进展,其LMA2广告大模型系列中的URM(UniversalRecommendationModel)通用召回大模型重磅亮相。URM通用召回大模型利用大量电商领域数据,通过post-training方式将大模型通用知识与电商领域专家知识对齐,能精准预测消费者潜在购物需求。

在AIGC领域,阿里妈妈推出的淘宝星辰・图生视频2.0版可支持一次生成10秒左右的短视频,基于视频生成大模型的多图生成带货短视频全链路产品,能为商家自动剪辑生成1分钟电商带货视频,测试数据显示个性化AI视频可将点击率提升17个百分点。此外,淘天集团未来生活实验室聚焦大模型、多模态等AI技术方向,成立一年多来已在大语言模型、多模态等领域取得多项技术突破,在国际顶会发表论文20篇以上。淘天集团还搭建起包括多模态大模型、搜推广大模型、视频生成大模型等在内的大模型家族,多模态大模型通用能力达到国内第一梯队水平,并在电商领域进行垂直增强。​

本届大会不仅有前沿技术成果展示,还涵盖4场专题报告、6个专题会议。香港科技大学计算机科学与工程系教授权龙,腾讯首席科学家、腾讯RoboticsX实验室负责人张正友,加州大学圣地亚哥分校教授费德里科・罗萨诺等来自国内外知名高校及研究机构的40余位嘉宾进行了学术演讲,呈现全球AGI研究的最新突破。专题会议聚焦多智能体、多模态交互、认知与社交智能的基础理论,具身智能的应用探索,AI与法律、经济、安全、艺术的融合创新,以及AGI芯片与系统的软硬件协同发展等热点方向与前沿话题。大会还特设青年科研成果展,百余篇论文集中展示AGI领域突破性研究,18项成果获评“人气海报奖”,促进了青年科研人员与院士专家的学术交流与传承。

「93913原创内容,转载请注明出处」