
上海人工智能实验室(上海AI实验室)正式发布并开源“书生”科学多模态大模型Intern-S1。这一模型在多模态能力方面位居全球开源第一,文本能力与国内外一流模型不相上下,科学能力在全模态范围达到国际领先水平,作为融合了科学专业能力的基础模型,其综合性能在当前开源模型中独占鳌头。
在科学探索进程中,传统单一模态分析在面对复杂现象,特别是跨学科领域的深度研究时,暴露出明显的局限性。Intern-S1创新性地在同一模型内实现了语言和多模态性能的高水平均衡发展,堪称“全能高手”;同时,它富集多学科专业知识,重点强化科学能力,在化学、材料、地球等多学科专业任务基准测试中,超越了顶尖闭源模型Grok-4,堪称“科学明星”。此外,Intern-S1开创了“多任务的通专融合”新范式,支持大规模多任务强化学习同步推进,在保持综合能力的同时实现专业领域的精通。
在综合多模态通用能力评估中,Intern-S1得分与国内外一流模型相当,展现出跨越文本、图像等多种形式的全面理解能力。该评估涵盖多项通用任务评测基准的平均分,有力证明了其在多场景任务中的强大鲁棒性与适应性,面对复杂输入组合也能从容应对。在由多个领域专业评测集构成的科学能力评测里,Intern-S1领先于Grok-4等最新闭源模型。评测范围覆盖物理、化学、材料、生物等领域的复杂专业任务,充分验证了模型在科研场景中的强大逻辑性与准确性,树立了行业新的标杆。
当前主流模型在自然语言处理、图像识别等方面虽有出色表现,但在处理复杂、精细且高度专业化的科研任务时,仍存在显著不足。一方面,现有开源模型普遍缺乏对复杂科学数据的深度理解,难以满足科研场景对精度、专业性和推理能力的极高要求。另一方面,性能更优的闭源模型存在部署门槛高、可控性差等问题,使得科研工作者在实际应用中面临高成本、低透明度的现实难题。
Intern-S1首创“跨模态科学解析引擎”,能够精准解读化学分子式、蛋白质结构、地震波信号等多种复杂科学模态数据,并具备一系列前沿科研能力,如预测化合物合成路径、判断化学反应可行性、识别地震波事件等,真正推动AI从“对话助手”向“科研搭档”转变,助力全面重塑科研生产力。
基于Intern-S1强大的跨模态生物信息感知与整合能力,上海AI实验室联合临港实验室、上海交通大学、复旦大学、MIT等研究机构协同攻关,共同构建了多智能体虚拟疾病学家系统——“元生”(OriGene)。该系统可用于靶标发现与临床转化价值评估,已在肝癌和结直肠癌治疗领域分别提出新靶点GPR160和ARG2,并通过真实临床样本和动物实验验证,形成完整科学闭环。
体系化的技术创新为Intern-S1的能力突破提供了有力支撑。它融合了“书生”大模型家族的优势,在同一模型内实现语言和多模态性能的高水平均衡发展,成为新一代开源多模态大模型的典范。










