研究人员以不到50美元的价格创建可与OpenAI o1相媲美的模型

🤖 由文心大模型生成的文章摘要

斯坦福大学和华盛顿大学的人工智能研究人员以不到50美元的云计算积分训练了人工智能“推理”模型。

该模型名为s1，在数学和编码能力测试中，其表现与OpenAI o1和DeepSeek R1等尖端推理模型类似。s1模型可在GitHub上获取，同时还可获得用于训练该模型的数据和代码。

s1开发团队表示，从现成的基础模型开始，然后通过提炼对模型进行微调，即通过对另一个人工智能模型的答案进行训练，提取其“推理”能力的过程。

研究人员表示，s1是从谷歌推理模型Gemini 2.0 Flash Thinking Experimental中提炼出来的。提炼方法与伯克利研究人员上个月以约450美元的价格创建AI推理模型所采用的方法相同。

对于某些人来说，少数研究人员即使没有数百万美元的资金支持，仍可以在人工智能领域进行创新，这种想法令人兴奋。

但s1提出了有关人工智能模型商品化的真正问题。

如果有人能够以相对零花钱的方式精确复制价值数百万美元的模型，那么护城河在哪里呢？

s1论文提出，通过使用一种称为监督微调（SFT）的过程，采用相对较小的数据集提炼推理模型，在此过程中，明确指示AI模型模仿数据集中的某些行为。

SFT往往比DeepSeek用于训练其竞争对手OpenAI o1模型R1的大规模强化学习方法更便宜。

「93913原创内容，转载请注明出处」

相关文章