


Sonnet 4.6 是 Anthropic 迄今为止最强大的 Sonnet 模型,在编码、计算机使用、长上下文推理、智能体规划、知识工作和设计方面实现了全面升级。它具备 测试版中 100 万 token 的上下文窗口,以接近 Opus 级别的智能水平,价格却使其适用于更多任务。定价与 Sonnet 4.5 保持一致,每百万 token 起价为 3 美元/15 美元,使其成为 claude.ai 和 Claude Cowork 上免费版和专业版用户的默认模型。
与之前的 Sonnet 模型相比,Sonnet 4.6 在计算机使用技能方面有显著提升。早期用户报告称,在浏览复杂电子表格或完成多步骤网页表单等任务中,其能力达到 人类水平,且所有这些操作都能跨多个浏览器标签页协调进行。
该模型在测试版中支持 100 万 token 的上下文窗口,使其能够处理并推理极长的文档、代码库或对话历史,而不会丢失连贯性。
Sonnet 4.6 在各项基准测试中均有提升,接近 Opus 级别的智能水平。获得早期访问权限的开发者 对 Sonnet 4.6 的偏好远超其前代产品,甚至常常超过 2025 年 11 月的 Claude Opus 4.5。
广泛的安全评估显示,Sonnet 4.6 与其他近期 Claude 模型一样安全,甚至更安全。安全研究人员描述其具有“普遍温暖、诚实、亲社会且时而幽默的性格,非常强的安全行为,且在高风险形式的不对齐方面没有重大问题的迹象。”
以往需要借助 Opus 级模型才能实现的性能,如今以 Sonnet 的价格即可通过 Sonnet 4.6 获得。
这种高端 AI 能力的普及意味着,从复杂的电子表格导航到多步骤网页表单填写等具有经济价值的办公任务,现在可供更多用户使用。该模型在 OSWorld 计算机使用基准测试中的稳步提升,加上对提示注入攻击的更强抵抗力,使其成为需要可靠自动化而无需定制 API 集成的组织的实用选择。
你需要一个在接近 Opus 智能水平与 Sonnet 级价格之间取得平衡的模型,尤其适用于编码、计算机使用或长上下文推理任务。如果你的组织依赖难以通过传统 API 实现自动化的旧版软件,或者你想要一个能够处理从智能体规划到设计工作等所有任务而无需在不同层级间切换的默认模型,那么它也值得关注。
其他您可能感兴趣的工具
Mistral 3 包含三款最先进的小型密集模型(14B、8B 和 3B),以及 Mistral Large 3——我们迄今为止能力最强的模型——这是一款稀疏混合专家模型,训练时使用了 41B 活跃参数和 675B 总参数。所有模型均依据 Apache 2.0 许可证发布。Ministral 模型在其类别中代表了最佳性能与成本比。同时,Mistral Large 3 跻身于前沿指令微调开源模型之列。
Okara 让您无需处理基础设施搭建,即可使用 30 多种强大的开源 AI 模型。像 Kimi 和 DeepSeek 这类顶级模型体积过大,无法在您的笔记本电脑上运行,我们为您代劳。在聊天中切换模型、搜索 Google、Reddit、X、YouTube,分析文件、生成图像,并与您的团队协作。所有内容均经过加密,我们绝不会利用您的数据进行训练。
Loading comments…
制作者
pixelpunk
访问网站
anthropic.com/news/claude-sonnet-4-6
项目信息
产品关键词