商汤科技推出了SenseNova 5.0,该AI模型性能似乎已经超越了OpenAI多模态大语言模型 GPT-4。
据Medium报道,SenseNova 5.0在各种基准测试中都超越了广受好评的GPT-4,这些措施包括逻辑推理和创造性写作。
新模型描述了一种更好的理解和生成类似人类文本的能力,展示了应用于现实世界应用的实用性和有效解决方案。
SenseNova 5.0于2024年4月8日在上海举行的科技日活动上亮相,会上还推出了“云到边缘”全栈大模型产品矩阵。
这种新的生成式人工智能模型代表了人工智能领域的重大进步,该模型集成了变压器和循环神经网络架构。此外,已在来自多种语言和来源的超过100亿个令牌的多样化数据集上进行了训练。
另外,据美通社报道,SenseNova 5.0进行了超过10TB的代币训练,涵盖了大量的合成数据。
该模型在推理过程中基于“混合专家”机制覆盖大约20万个上下文窗口,从而提高了其有效性,模型主要进步在于理论知识、数学、推理和编码能力。
不仅如此,SenseNova 5.0的优越性能与ChatGPT-4先进的学习优化技术相媲美,可以有效处理大量数据。因此,能够产生更准确的输出。
商汤科技董事长兼首席执行官徐立表示:“在AGI时代,数据、算法和计算力这三大要素正在经历一场新的演变。随着多模态的引入,模型参数的数量将呈指数级增长,数据量将大幅增长,从而导致对计算力的需求持续激增。”
徐立强调,公司与SenseCore一起构建了AGI时代的基础设施,并将基础模型命名为“SenseNova”,寓意“不断更新,每日更新,进一步更新”,“我们希望不断更新模型的迭代速度和解决问题的能力,为AGI解锁更多的可能性。”
商汤科技联合创始人、首席科学家王晓刚表示,人工智能催生了一种新的研究范式,它基于强大的基础模型,通过强化学习和人类反馈来释放新的能力,从而有效解决开放式任务。“AGI将从‘数据飞轮’进化为‘智慧飞轮’,最终实现人机共生。”
王晓刚认为,商汤科技已经建立了一个全栈的基础模型研发体系,并在多个行业开发了应用。“场景的多样性、任务的复杂性和数据的丰富性,都展示了我们基础模型的能力和潜力。”