
Inflection AI宣布将其备受欢迎的Pi聊天机器人更新至2.5版。此次更新引入的全新模型,不仅延续了Pi聊天机器人卓越的情商表现,在智力水平上更是实现了质的飞跃,足以与行业内的顶尖模型GPT-4和Gemini相抗衡。令人瞩目的是,训练这一强大模型所需的计算代价仅为GPT-4的40%,这一突破性进展为人工智能的发展开辟了新的路径。
自2023年5月推出以来,Pi聊天机器人凭借其独特的同理心、实用性和安全性,迅速在用户中积累了极高的人气。去年11月推出的基础模型Inflection-2,已然在当时的大语言模型(LLM)领域中占据了领先地位。而此次推出的Inflection-2.5模型,更是将Pi的能力提升到了一个全新的高度。它融合了强大的基础能力,能够在各种复杂任务中表现出色,与GPT-4、Gemini等世界顶尖的LLM不相上下,同时还保留了Pi标志性的个性化特点和独特的同理心微调,为用户提供更加贴心、智能的交互体验。
在性能测试中,Inflection-2.5展现出了令人惊叹的实力。此前的Inflection-1模型仅使用了GPT-4训练计算量(FLOPs)的4%,就在多项以智力为核心的任务上达到了GPT-4水平的72%。而全新的Inflection-2.5,在仅使用GPT-440%训练FLOPs的情况下,平均性能超过了GPT-4的94%。尤其在科学、技术、工程和数学等STEM领域,Inflection-2.5的进步尤为显著。在MMLU基准测试中,该模型相比Inflection-1有了巨大的提升;在极端困难的专家级基准测试GPQADiamond中,Inflection-2.5也表现出色,在maj@8的评分标准下,其表现达到了所有参考人群的第85百分位,在maj@32的评分标准下,更是几乎拿到了95百分位的高分。在BIG-Bench-Hard测试中,Inflection-2.5比初代Inflection-1提升了超过10%,与GPT-4的差距缩小至仅有0.9%。
在实际应用场景中,Pi聊天机器人的能力也得到了充分验证。随着Inflection-2.5的上线,用户与Pi的对话话题变得更加广泛。他们不仅能够与Pi讨论最新的时事,获取本地餐厅的推荐,还能借助Pi备考生物学考试、草拟商业计划、进行编程,甚至在准备重要对话或分享兴趣爱好时,Pi都能提供有价值的建议和帮助。目前,Inflection每天拥有一百万活跃用户,每月活跃用户数更是高达六百万。这些用户与Pi的互动信息已经超过了四十亿条,平均对话时长达到33分钟,每天有十分之一的用户与Pi的对话时长超过一小时。每周约有60%的用户在与Pi交流后,会在下周继续回来与它对话,用户粘性明显高于其他竞品。








