SenseNova 5.0：AI模型性能超越OpenAI GPT-4

🤖 由文心大模型生成的文章摘要

商汤科技推出了SenseNova 5.0，该AI模型性能似乎已经超越了OpenAI多模态大语言模型 GPT-4。

据Medium报道，SenseNova 5.0在各种基准测试中都超越了广受好评的GPT-4，这些措施包括逻辑推理和创造性写作。

新模型描述了一种更好的理解和生成类似人类文本的能力，展示了应用于现实世界应用的实用性和有效解决方案。

SenseNova 5.0于2024年4月8日在上海举行的科技日活动上亮相，会上还推出了“云到边缘”全栈大模型产品矩阵。

这种新的生成式人工智能模型代表了人工智能领域的重大进步，该模型集成了变压器和循环神经网络架构。此外，已在来自多种语言和来源的超过100亿个令牌的多样化数据集上进行了训练。

另外，据美通社报道，SenseNova 5.0进行了超过10TB的代币训练，涵盖了大量的合成数据。

该模型在推理过程中基于“混合专家”机制覆盖大约20万个上下文窗口，从而提高了其有效性，模型主要进步在于理论知识、数学、推理和编码能力。

不仅如此，SenseNova 5.0的优越性能与ChatGPT-4先进的学习优化技术相媲美，可以有效处理大量数据。因此，能够产生更准确的输出。

商汤科技董事长兼首席执行官徐立表示：“在AGI时代，数据、算法和计算力这三大要素正在经历一场新的演变。随着多模态的引入，模型参数的数量将呈指数级增长，数据量将大幅增长，从而导致对计算力的需求持续激增。”

徐立强调，公司与SenseCore一起构建了AGI时代的基础设施，并将基础模型命名为“SenseNova”，寓意“不断更新，每日更新，进一步更新”，“我们希望不断更新模型的迭代速度和解决问题的能力，为AGI解锁更多的可能性。”

商汤科技联合创始人、首席科学家王晓刚表示，人工智能催生了一种新的研究范式，它基于强大的基础模型，通过强化学习和人类反馈来释放新的能力，从而有效解决开放式任务。“AGI将从‘数据飞轮’进化为‘智慧飞轮’，最终实现人机共生。”

王晓刚认为，商汤科技已经建立了一个全栈的基础模型研发体系，并在多个行业开发了应用。“场景的多样性、任务的复杂性和数据的丰富性，都展示了我们基础模型的能力和潜力。”

「93913原创内容，转载请注明出处」

相关文章