上海AI实验室开源量产书生S1-Pro:万亿参数破局,国产算力生态迎爆发式增长

🤖 由 文心大模型 生成的文章摘要

2月4日晚间,上海人工智能实验室(以下简称“上海AI实验室”)正式宣布,开源全球首个基于“通专融合”架构的万亿参数科学多模态大模型——Intern(书生)-S1-Pro,并启动规模化量产。这一里程碑式举措不仅刷新了全球科学多模态模型的参数规模纪录,更凭借对华为昇腾、沐曦等国产芯片的深度全栈适配,成功打通“算法-算力”协同壁垒,直接激活国内算力租赁市场活力,据行业调研显示,国内主流算力租赁商相关订单短期内暴增200%,国产AI生态迎来“模型+算力”双向赋能的全新发展阶段。

作为上海AI实验室书生大模型家族的全新旗舰产品,书生S1-Pro的推出历经多年技术积淀与迭代升级。回溯书生大模型的发展历程,其自2021年由上海AI实验室联合商汤科技、香港中文大学、上海交通大学共同发布以来,逐步从中国首个覆盖多种视觉任务的通用大模型,升级为涵括视觉、语言、三维等在内的完整大模型体系,先后推出书生2.0、书生2.5、书生·浦语等系列产品,在计算机视觉顶级会议CVPR 2023中斩获最佳论文奖,实现中国学术机构在该奖项上的历史性突破,此次书生S1-Pro的开源量产,更是将这一技术体系推向新的高度。

此次开源的书生S1-Pro,最引人瞩目的亮点的是其万亿参数规模与“通专融合”的架构创新。据上海AI实验室介绍,该模型总参数量达到1万亿,是目前全球开源社区中参数规模最大的科学多模态模型,但其并未因超大参数陷入“笨重低效”的困境——依托创新的混合专家架构(MoE),模型内部相当于有512位各领域“顶尖专家”坐镇,面对具体科学问题时,仅需激活约2%的参数(220亿)即可高效完成复杂数理逻辑推理,实现了“大参数规模”与“高效率运行”的双重突破。

更具行业突破性的是,书生S1-Pro在底层技术上实现了对物理世界规律的深度适配。为解决科学领域数据密度差异巨大的痛点——如天文学的微弱信号捕捉与生命科学的海量实验数据处理,研发团队引入“傅里叶位置编码(FoPE)”并重构“时序编码器”,为模型赋予“双重视觉与听觉”:既能微观捕捉单个数据节点的细节,又能宏观把握整体数据的规律与趋势,真正实现了“既见沙粒,亦见沙丘”的科学认知能力。这种底层创新,让书生S1-Pro成功构建起横跨化学、材料、生命、地球、物理五大核心学科的全谱系能力矩阵,涵盖100多个专业子任务,在国际数学奥林匹克(IMO-Answer-Bench)、国际物理奥林匹克(IPhO2025)等权威基准测试中展现出竞赛级解题能力,在SciReasoner等高难度综合学科评测中,成绩稳居全球第一梯队,可精准解析复杂分子结构图、预测理化性质、捕捉数据因果规律,从“解题”向“解决真实科研问题”跨越。

「93913原创内容,转载请注明出处」