综合多方信息来看,Claude 模型有两个老议题:一个是爱封号,另一个是贵。
至于回到用户这一侧,Claude 的处境其实有点尴尬:好用,但还没有好用到可以无脑依赖;昂贵,又还没有贵到让人彻底放弃。
与此同时,市场消息称 Anthropic 的收入运行率已经突破 470 亿美元。这样的增长速度很惊人,也意味着公众市场会用更严格的标准审视它。
它们在不同方向上发力,但最终汇聚到同一个目标:Anthropic 不想只证明 Claude 会聊天、会写代码,还要证明 Claude 可以进入长期、复杂、专业、付费意愿更强的工作场景。
Anthropic 当然可以说自己在做更安全的 AI,只是用户发现自己沉淀的数字资产可能被误伤,被一两封轻飘飘邮件带走时,所谓「负责任的 AI」,就很难只靠所谓安全的系统卡来解释。
放在产品线上看,Sonnet 5 是一次常规升级。放在 Anthropic 眼下的时间点看,它更像是一张递给开发者、企业客户和 IPO 市场的答卷。
Anthropic 悄摸摸地在脚注中提到,Sonnet 5 使用了更新后的 tokenizer,同样一段输入文本可能会产生更多 tokens,大约是原来的 1.0 到 1.35 倍,具体取决于内容类型。
具体而言,UCSF Brain Tumor Center 的 Stephen Francis 则用它加速胶质瘤分子流行病学研究,称部分分析时间被压缩到原来的十分之一左右。
即日起到 2026 年 8 月 31 日,Claude Sonnet 5 在 API 上的输入价格为每百万 tokens 2 美元,输出价格为每百万 tokens 10 美元。9 月 1 日后,标准价格恢复到输入每百万 tokens 3 美元、输出每百万 tokens 15 美元。
众所周知,在 Claude 的产品线里,中杯 Sonnet 本来就是 Claude 走向开发者社区的关键入口。
作为对比,Opus 4.8 的价格是输入每百万 tokens 5 美元、输出每百万 tokens 25 美元。这个差价,正是 Anthropic 想让开发者从 Opus 试验,转向 Sonnet 规模化部署的关键。
6 月初,Anthropic 已经秘密提交 IPO 招股书草案,正式进入上市准备阶段。市场对 Anthropic 的期待,已经被融资和收入增长推得很高。
同一天,Anthropic 还发布了另一款产品:Claude Science。
Claude Science 则把这个问题推向更专业的场景。科研机构、药企、医疗研究团队、大学实验室,都是 AI 公司争夺的高价值客户。它们对模型能力、可审计性、数据安全和可复现性要求更高。
就在刚刚,Claude Sonnet 5 正式揭晓。按照官方说法,Sonnet 5 是现在最具 agent 能力的 Sonnet 模型,可以制定计划,调用浏览器和终端等工具,并在更复杂的任务中自主执行。
和 Sonnet 5 面向开发者、企业用户的模型升级不同,Claude Science 瞄准的是科学研究场景。按照 Anthropic 的说法,它是一个面向科学家的 AI workbench,可以把研究人员日常使用的工具、数据库、计算资源和论文写作流程放进同一个环境里。
Sonnet 5 发布,但却是便宜版 Opus
而 Sonnet 5 也好、Claude Science 也罢,一个面向开发者和企业生产流程,一个面向科研、生命科学和医疗相关研究。
目前,Claude Science 已以 beta 形式开放给 Claude Pro、Max、Team 和 Enterprise 用户,支持 macOS 和 Linux。Team 和 Enterprise 用户需要管理员启用。
它还能原生渲染 3D 蛋白结构、基因组浏览器轨道、化学结构等科学对象,并支持用户用自然语言修改图表,比如去掉网格线,或者把坐标轴改成对数尺度。
Claude Science 想做的,就是把这些分散工具整合起来,让科学家可以在一个会话里完成文献分析、多步骤研究、图表生成、手稿修改和计算任务。
从产品定位看,Anthropic 想把过去更多属于 Opus 高端模型的能力,下放到更常用、价格更低的 Sonnet 产品线上。Claude 这次升级,核心并不只是模型变强,也是在重新权衡「好用」与「用得起」之间的关系。
事实上,根据我的体验,Sonnet 5 表现也并未有肉眼可见的进步,反倒给我一种是打着 Agent 原生模型的旗号,却是为了省算力而急匆匆发布的即视感。
但过去一年,Anthropic 最明显的能力提升集中在 Opus 高端模型上。
研究人员要查 PubMed,要写 Jupyter Notebook,要跑 R,要连接集群终端,还要处理各种数据库、文件格式和数据管线。
Anthropic 还会支持最多 50 个 Claude Science AI for Science 项目,每个项目最高提供 3 万美元 credits,Modal 也会为部分项目提供最高 2000 美元算力支持,申请截止到 2026 年 7 月 15 日。
Anthropic 反复强调「成本和性能曲线」,原因也在这里。Sonnet 5 的重点,不是把 Opus 完全替换掉,而是让更多任务在更低成本下获得接近 Opus 的 agent 能力。
对 Anthropic 来说,IPO 叙事不能只停留在 Claude 很强。投资人真正关心的是:强模型能不能变成稳定收入;高收入背后的毛利率能不能站住;近万亿美元估值,能不能由企业客户、订单、API 使用量和专业场景长期支撑。
以 Firefox 147 漏洞利用评测为例,Sonnet 4.6 和 Sonnet 5 都没有成功写出完整可运行的 exploit,Sonnet 5 只是在部分成功率上略高于 Sonnet 4.6。Anthropic 认为,这更多来自模型通用能力提升,而非针对网络攻击能力做了专门训练。
官方称,Sonnet 5 相比 Sonnet 4.6 更擅长拒绝恶意请求,也更能抵抗 prompt injection 攻击,幻觉和迎合倾向也更低。在自动化行为审计中,Sonnet 5 的不良行为率低于 Sonnet 4.6,但仍高于 Opus 4.8 和 Claude Mythos Preview。
传闻细节仍有待核实,但 Claude 频繁封号已不争的事实。昨天一觉醒来,我也发现第五个 Claude 账号也被封了。
▲ 🔗 https://www.anthropic.com/news/claude-science-ai-workbench
Claude 3.5 Sonnet、3.6 Sonnet 和 3.7 Sonnet 曾让很多人第一次认真把 Claude 用进写代码、调用工具和处理长任务的工作流里。对不少开发者来说,AI agent 时代最早的体感,正是从 Sonnet 级模型启动的。
更麻烦的是,它已经开始承载越来越多不该被轻易拿走的东西:几年的对话、项目里的文档、调好的提示词、写作偏好、Claude Code 里的工作流,以及各种长期积累下来的上下文。
对涉及大规模数据和敏感数据的科研场景来说,一个关键卖点是数据可以留在实验室已有基础设施上,只有每一步分析所需的上下文会发送给 Claude。
不只想写代码,Anthropic 也要用 Claude 讲一个更大的故事
Anthropic 称,Sonnet 5 在推理、工具调用、编程和知识工作等方面,相比 Sonnet 4.6 有明显提升,整体能力接近 Opus 4.8,但价格更低。官方给出的定位也很明确:Opus 4.8 仍然适合追求更高准确率的任务,Sonnet 5 则提供一个成本更低、能力更接近高端模型的选择。
从价格看,Anthropic 这次给了一个首发窗口期。
不过,Sonnet 5 的便宜并不完全等于,该花的账单会有一个断崖式的下降。
一个用户可以理解平台有规则,却很难理解自己付了费、搭了工作流、沉淀了数据之后,账号命运还要像抽盲盒一样交给一套看不见的 AI 风控系统。
科学研究里有大量琐碎工作。
▲ 官方博客🔗 https://www.anthropic.com/news/claude-sonnet-5
Anthropic 还为 Claude Science 预置了 60 多个科学技能和连接器,覆盖基因组学、单细胞、蛋白质组学、结构生物学、化学信息学等方向。它可以连接 UniProt、PDB、Ensembl、Reactome、ClinVar、ChEMBL、GEO 等数据库,也能使用 NVIDIA BioNeMo Agent Toolkit,调用 Evo 2、Boltz-2、OpenFold3 等生命科学模型和库。
因此,Sonnet 5 默认启用了网络安全防护机制,用于实时识别和拦截危险用途。不过 Anthropic 判断 Sonnet 5 的整体网络安全风险较低,所以防护强度低于 Fable 5。
对普通用户来说,Claude Sonnet 5 从今天起面向所有套餐开放,成为 Free 和 Pro 用户的默认模型,Max、Team 和 Enterprise 用户也可以使用。同时,它也进入 Claude Code 和 Claude Platform,开发者可以通过 claude-sonnet-5 调用。
▲API 价格🔗 https://platform.claude.com/docs/en/about-claude/pricing
网络安全能力方面,Anthropic 说道并没有专门训练 Sonnet 5 做高风险网络安全任务。它能完成一些常规、无害的网络安全工作,但在危险能力评测中,明显弱于 Opus 4.8 和 Mythos 5。
至于后者,Anthropic 也给出了最新答案。
Sonnet 5 要解决的,正是这个落差难题。
这恰逢 Anthropic 的 IPO 故事逐步清晰之际。
Opus 更强,也更贵。Sonnet 仍然是主力选择,但在复杂任务、长时间执行、工具调用和高难度推理上,和 Opus 的差距被逐渐拉开。
能力之外,安全也是 Anthropic 这次发布的重点。
也就是说,开发者不能只看每百万 tokens 的标价,还要看真实任务里的 token 消耗、缓存命中率和输出长度。
前者,在过去一周,很多 Claude 用户早就见识过了。社交平台上关于 Anthropic 风控的讨论越来越离奇,从锁 IP、异地登录触发审查,到「不要随便打开 Anthropic 发来的邮件」的提醒,理由是邮件打开位置或许被用于判断账号所在地。
在算力层面,Claude Science 可以连接研究人员已有的本地电脑、Linux 机器、HPC 集群登录节点,也可以调用 Modal 之类的按需算力。它会先拟定计划,在访问新资源前请求确认,再提交计算任务。
必须承认,Claude 本来就没有正式面向国内用户开放,但问题在于,封号、误判、邮件定位、申诉低效,这一整套奇葩操作放在任何主流商业服务里都显得匪夷所思。
帮忙写代码只是它的一个核心亮点,Anthropic 强调,Claude Science 生成的结果会带有可审计历史,包括图表背后的代码、运行环境、自然语言说明和完整消息记录。研究人员可以检查一个结果是怎么来的,也可以在几个月后重新复现。
今年 2 月,Anthropic 以约 3800 亿美元估值完成 300 亿美元融资,年化收入约 140 亿美元。到 5 月底,Anthropic 又完成 650 亿美元 Series H 融资,投后估值达到 9650 亿美元,Altimeter Capital、Sequoia Capital 等机构参与领投。
Claude 让人看见 AI 的能力上限,但殊不知,平台的下限也同样核心。犹高谈责任,真无耻之尤也。
总而言之,这一事件仍在持续发酵,后续进展值得关注。