研究人员以不到50美元的价格创建可与OpenAI o1相媲美的模型

🤖 由 文心大模型 生成的文章摘要

斯坦福大学和华盛顿大学的人工智能研究人员以不到50美元的云计算积分训练了人工智能“推理”模型。

该模型名为s1,在数学和编码能力测试中,其表现与OpenAI o1和DeepSeek R1等尖端推理模型类似。s1模型可在GitHub上获取,同时还可获得用于训练该模型的数据和代码。

s1开发团队表示,从现成的基础模型开始,然后通过提炼对模型进行微调,即通过对另一个人工智能模型的答案进行训练,提取其“推理”能力的过程。

研究人员表示,s1是从谷歌推理模型Gemini 2.0 Flash Thinking Experimental中提炼出来的。提炼方法与伯克利研究人员上个月以约450美元的价格创建AI推理模型所采用的方法相同。

对于某些人来说,少数研究人员即使没有数百万美元的资金支持,仍可以在人工智能领域进行创新,这种想法令人兴奋。

但s1提出了有关人工智能模型商品化的真正问题。

如果有人能够以相对零花钱的方式精确复制价值数百万美元的模型,那么护城河在哪里呢?

s1论文提出,通过使用一种称为监督微调(SFT)的过程,采用相对较小的数据集提炼推理模型,在此过程中,明确指示AI模型模仿数据集中的某些行为。

SFT往往比DeepSeek用于训练其竞争对手OpenAI o1模型R1的大规模强化学习方法更便宜。

「93913原创内容,转载请注明出处」