
长期以来,人工智能领域存在一个普遍困境:即便最先进的大模型能精准演算微积分、流畅编写代码,面对人类细腻复杂的情感表达时,却常沦为只会说”多喝热水”的”情感直男”。12月10日,这一僵局被NatureSelect研究团队彻底打破——全球首个专注情感交互的大模型Echo-N1正式发布,其仅320亿(32B)的参数量,在多轮情感陪伴任务中竟以46.7%的胜率,远超千亿参数商业模型Doubao 1.5 Character的13.3%,为AI情感交互领域树立了全新标杆。
此次Echo-N1的核心突破,在于颠覆了传统强化学习(RL)难以适配主观情感领域的技术瓶颈。NatureSelect团队负责人在发布会上解释,情感表达的模糊性与主观性,使得传统标量奖励机制无法捕捉”我很好”背后的崩溃情绪,更易导致模型陷入”堆砌华丽辞藻却毫无共情”的奖励黑客困境。为此,团队创新性提出”情感强化学习”范式,构建生成式奖励模型,让AI在输出回复前先完成逻辑严密的情感推理路径——先通过用户历史对话完成深度画像侧写,再基于认知、情感、动机三维需求推导共鸣策略。
这套创新体系包含双重奖励机制:拟人度奖励(Humanlike Reward)专门清除AI的”助手味”,通过上下文感知惩罚逻辑矛盾与内容幻觉,确保回复具备真实人际交流的自然感;共情奖励(Empathy Reward)则实现千人千面的个性化响应,将普世价值观作为”公理”,个性化需求作为”定理”,结合”人机回环”验证机制保障情感反馈的准确性。为解决情感效果难以量化的科学难题,团队更打造”共情的心理物理模型(EPM)”,将用户的情绪痛苦转化为可计算的”心理势能”,AI的共情回复则成为”心理做功”,通过认知重构、情感共鸣、主动赋能(MDEP)三维空间实现情感效果的可视化追踪。
严苛的”拟人化认知沙盒”测试更印证了其性能跃升。这个模拟人类大脑多模块协同的多智能体系统,能实时捕捉对话中的情感流动,灵活调配记忆资源与互动策略。在30个高难度心理场景测试中,未经情感训练的同参数量基座模型Qwen3-32B通过率为0%,而Echo-N1综合得分达73.54分,远超Doubao 1.5 Character的42.95分。测试数据显示,面对”职场PUA后如何重建自信”等复杂问题,Echo-N1不仅能避免”加油,你很棒”的空泛安慰,还会结合用户提及的职业背景,给出”你上次独立完成的项目已经证明了专业能力,这次的否定更像是管理问题”的针对性回应,同时主动引导用户梳理情绪触发点。










