Anthropic重磅发布Claude Opus 4.6,多维度突破重构AI专业能力边界

🤖 由 文心大模型 生成的文章摘要

2026年2月,人工智能领域迎来重磅迭代——Anthropic正式推出旗舰级大语言模型Claude Opus 4.6,此次更新以“能力跃迁、场景深耕”为核心,在上下文处理、输出容量、专业评测、协作模式及落地适配五大维度实现突破性升级,不仅将上下文窗口规模提升至100万token,更在专业领域评测中大幅领先同类模型,新增的AI代理团队功能与本地文件接入能力,进一步推动AI从“实用工具”向“全能专业协作者”转型,引发全球科技界与各行业的广泛关注。

作为本次升级的核心亮点,Claude Opus 4.6将上下文窗口容量扩充至100万token,较前代产品实现5倍跨越式提升,彻底打破了长期困扰大模型的“长文本处理瓶颈”。这一容量相当于可一次性容纳75万个英文单词或50万个中文字符,足以完整承载整本《三体》全集级别的海量内容,无需用户手动拆分文档、反复补充上下文,真正实现了“一次输入、完整理解”。更值得关注的是,此次升级并非单纯的容量扩容,Anthropic通过多尺度注意力机制、动态上下文压缩及位置编码优化等底层技术创新,有效解决了以往大模型“上下文腐烂”的痛点——即输入文本过长时性能急剧下降、关键信息丢失的问题。在MRCR v2“大海捞针”权威测试中,Claude Opus 4.6在100万token文本中检索隐藏信息的准确率达到76%,而前代模型Claude Sonnet 4.5仅为18.5%,差距高达4倍,证明其真正实现了对超长文本的“读懂、记牢、善用”,而非简单的“机械读取”。

在输出能力上,Claude Opus 4.6同步将最大输出长度提升至128K token,较前代的64K token实现翻倍,彻底终结了长文本创作“反复拆分、多次交互”的繁琐流程。无论是10万字的行业深度分析报告、完整的大规模代码片段及注释,还是多章节的学术研究综述,该模型都能一次性完成输出,且内容逻辑连贯、细节完整、专业度在线。据实测数据显示,依托这一升级,专业人士的长文本创作效率较前代提升60%以上,大幅减少了用户与AI之间的往复沟通成本,尤其适配内容创作、代码编写、报告撰写等对输出连续性要求极高的场景。

专业能力评测的全面领跑,进一步彰显了Claude Opus 4.6的硬实力。在GDPval-AA权威评测中,该模型以约144 Elo的显著优势超越GPT-5.2,同时较自身前代产品Claude Opus 4.5高出190个Elo分,这意味着在金融、法律等核心知识工作场景中,其表现优于同类模型的概率接近70%。除核心评测外,该模型在多领域基准测试中均斩获佳绩:在BigLaw Bench法律推理测试中,准确率达到90.2%,其中40%的测试取得满分;在SWE-bench Verified软件工程任务中得分79.2%,稳居行业前列;在生命科学领域的BioPipelineBench测试中,得分从Opus 4.5的28.5%大幅提升至53.1%,超越人类专家基线,展现出极强的跨领域适配能力与专业推理水平。

「93913原创内容,转载请注明出处」