
超参数科技正式发布新一代游戏智能体COTA,这款以大语言模型(LLM)为核心驱动的产品,凭借认知、执行、策略与辅助四大核心能力,打破传统游戏AI的技术瓶颈,主打“真正能用”的人机协同体验,为游戏行业AI应用范式带来颠覆性突破。
不同于传统游戏AI依赖强化学习与监督学习的局限模式,COTA以“打造有生命的AI”为研发理念,通过架构创新与技术优化,在强实时、高对抗的游戏场景中实现了性能飞跃。其命名源自认知(Cognition)、执行(Operation)、策略(Tactics)、辅助(Assistance)四大核心能力的英文缩写,精准概括了产品的核心价值定位——不仅能完成高精度操作,更能实现类人化的战术思考与协同配合。
COTA的核心突破源于超参数科技原创的“双系统分层架构”,灵感源自人类大脑“快慢系统”协同工作模式,成功解决了大模型在实时游戏场景中的响应速度难题。上层“指挥官”(Commander)作为战略中枢,依托Qwen3-VL-8B-Thinking基座模型,专注于宏观战术推理,通过分析地图环境、敌方动向、团队态势,制定“全员冲锋”“战术撤退”等精准战略方针,实现全局视野下的决策规划。
下层“行动专员”(Operator)则经过极致模型蒸馏,专注于指令落地执行,将上层战略拆解为毫秒级的微观操作。在FPS游戏实测中,其可流畅完成急停拉枪、掩体博弈、投掷物精准封烟、下包拆包等复杂动作序列,响应时间最快低至100ms,完全契合实时竞技游戏对速度与精度的严苛要求。这种解耦设计使COTA既具备人类高端玩家的战术意识,又拥有超越常人的操作稳定性。
为强化模型性能,COTA构建了多阶段精炼训练体系:通过优质游戏思维链(CoT)数据集完成监督微调(SFT)奠定基础,借助群相对策略优化(GRPO)算法通过大规模自我博弈提升复杂局势适应性,最终通过直接偏好优化(DPO)技术实现与人类高端玩家操作习惯的深度对齐,让AI行为更具拟人化特征。
“真正能用”的核心体验源于COTA对AI决策透明度的革新。依托思维链(Chain of Thought)技术,这款智能体首次将游戏AI的决策过程从“黑盒”转化为“白盒”,玩家可通过专属CoT面板实时查看AI的推理流,清晰洞悉每一个动作背后的逻辑动因——从战术指令分析、路径规划到行动指令输出,完整的思维链路一目了然。
在实机演示中,COTA展现出媲美顶尖人类玩家的竞技水平与协作能力。在超参数自研的FPS游戏环境中,其不仅能独立完成单兵作战任务,更能在5V5团队对抗中实现多角度交叉架枪、掩护队友突点、残局补枪等精细化配合,摆脱了传统AI的机械感。无论是进攻方的战术包抄,还是防守方的回防拆弹,COTA都能根据实时战局动态调整策略,展现出极强的局势适应能力。
自然语言交互能力进一步强化了“能用”属性。玩家可通过语音或文字向COTA下达战术指令,AI既能作为“高智商队友”执行操作配合,也能充当“战术教练”提供实时指导,大幅降低新手玩家的上手门槛,同时为高端玩家提供灵活的协作伙伴。








