记者从相关渠道获悉,Claude 模型有两个老问题:一个是爱封号,另一个是贵。
▲ 🔗 https://www.anthropic.com/news/claude-science-ai-workbench
同一天,Anthropic 还发布了另一款产品:Claude Science。
6 月初,Anthropic 已经秘密提交 IPO 招股书草案,正式进入上市准备阶段。市场对 Anthropic 的期待,已经被融资和收入增长推得很高。
Opus 更强,也更贵。Sonnet 仍然是主力选择,但在复杂任务、长时间执行、工具调用和高难度推理上,和 Opus 的差距被逐渐拉开。
作为对比,Opus 4.8 的价格是输入每百万 tokens 5 美元、输出每百万 tokens 25 美元。这个差价,正是 Anthropic 想让开发者从 Opus 试验,转向 Sonnet 规模化部署的关键。
Claude 3.5 Sonnet、3.6 Sonnet 和 3.7 Sonnet 曾让很多人第一次认真把 Claude 用进写代码、调用工具和处理长任务的工作流里。对不少开发者来说,AI agent 时代最早的体感,正是从 Sonnet 级模型开启的。
它还能原生渲染 3D 蛋白结构、基因组浏览器轨道、化学结构等科学对象,并支持用户用自然语言修改图表,比如去掉网格线,或者把坐标轴改成对数尺度。
众所周知,在 Claude 的产品线里,中杯 Sonnet 本来就是 Claude 走向开发者社区的关键入口。
官方称,Sonnet 5 相比 Sonnet 4.6 更擅长拒绝恶意请求,也更能抵抗 prompt injection 攻击,幻觉和迎合倾向也更低。在自动化行为审计中,Sonnet 5 的不良行为率低于 Sonnet 4.6,但仍高于 Opus 4.8 和 Claude Mythos Preview。
Anthropic 还为 Claude Science 预置了 60 多个科学技能和连接器,覆盖基因组学、单细胞、蛋白质组学、结构生物学、化学信息学等方向。它可以连接 UniProt、PDB、Ensembl、Reactome、ClinVar、ChEMBL、GEO 等数据库,也能使用 NVIDIA BioNeMo Agent Toolkit,调用 Evo 2、Boltz-2、OpenFold3 等生命科学模型和库。
Claude Science 则把这个问题推向更专业的场景。科研机构、药企、医疗研究团队、大学实验室,都是 AI 公司争夺的高价值客户。它们对模型能力、可审计性、数据安全和可复现性要求更高。
与此同时,市场消息称 Anthropic 的收入运行率已经突破 470 亿美元。这样的增长速度很惊人,也意味着公众市场会用更严格的标准审视它。
不只想写代码,Anthropic 也要用 Claude 讲一个更大的故事
Sonnet 5 发布,但却是便宜版 Opus
至于后者,Anthropic 也给出了最新答案。
它们在不同方向上发力,但最终汇聚到同一个目标:Anthropic 不想只证明 Claude 会聊天、会写代码,还要证明 Claude 可以进入长期、复杂、专业、付费意愿更强的工作场景。
于是,Sonnet 5 默认启用了网络安全防护机制,用于实时识别和拦截危险用途。不过 Anthropic 判断 Sonnet 5 的整体网络安全风险较低,所以防护强度低于 Fable 5。
就在刚刚,Claude Sonnet 5 正式发布。按照官方说法,Sonnet 5 是目前最具 agent 能力的 Sonnet 模型,可以制定计划,调用浏览器和终端等工具,并在更复杂的任务中自主执行。
在算力层面,Claude Science 可以连接研究人员已有的本地电脑、Linux 机器、HPC 集群登录节点,也可以调用 Modal 之类的按需算力。它会先拟定计划,在访问新资源前请求确认,再提交计算任务。
一个用户可以理解平台有规则,却很难理解自己付了费、搭了工作流、沉淀了数据之后,账号命运还要像抽盲盒一样交给一套看不见的 AI 风控系统。
▲ 官方博客🔗 https://www.anthropic.com/news/claude-sonnet-5
目前,Claude Science 已以 beta 形式开放给 Claude Pro、Max、Team 和 Enterprise 用户,支持 macOS 和 Linux。Team 和 Enterprise 用户需要管理员启用。
必须承认,Claude 本来就没有正式面向国内用户开放,但问题在于,封号、误判、邮件定位、申诉低效,这一整套奇葩操作放在任何主流商业服务里都显得匪夷所思。
▲API 价格🔗 https://platform.claude.com/docs/en/about-claude/pricing
更麻烦的是,它已经开始承载越来越多不该被轻易拿走的东西:几年的对话、项目里的文档、调好的提示词、写作偏好、Claude Code 里的工作流,以及各种长期积累下来的上下文。
至于回到用户这一侧,Claude 的处境其实有点尴尬:好用,但还没有好用到可以无脑依赖;昂贵,又还没有贵到让人彻底放弃。
对普通用户来说,Claude Sonnet 5 从今天起面向所有套餐开放,成为 Free 和 Pro 用户的默认模型,Max、Team 和 Enterprise 用户也可以使用。同时,它也进入 Claude Code 和 Claude Platform,开发者可以通过 claude-sonnet-5 调用。
Sonnet 5 要解决的,正是这个落差难题。
研究人员要查 PubMed,要写 Jupyter Notebook,要跑 R,要连接集群终端,还要处理各种数据库、文件格式和数据管线。
和 Sonnet 5 面向开发者、企业用户的模型升级不同,Claude Science 瞄准的是科学研究场景。按照 Anthropic 的说法,它是一个面向科学家的 AI workbench,可以把研究人员日常使用的工具、数据库、计算资源和论文写作流程放进同一个环境里。
从产品定位看,Anthropic 想把过去更多属于 Opus 高端模型的能力,下放到更常用、价格更低的 Sonnet 产品线上。Claude 这次升级,核心并不只是模型变强,也是在重新权衡「好用」与「用得起」之间的关系。
也就是说,开发者不能只看每百万 tokens 的标价,还要看真实任务里的 token 消耗、缓存命中率和输出长度。
Anthropic 当然可以说自己在做更安全的 AI,只是用户发现自己沉淀的数字资产可能被误伤,被一两封轻飘飘邮件带走时,所谓「负责任的 AI」,就很难只靠所谓安全的系统卡来解释。
Anthropic 悄摸摸地在脚注中提到,Sonnet 5 使用了更新后的 tokenizer,同样一段输入文本可能会产生更多 tokens,大约是原来的 1.0 到 1.35 倍,具体取决于内容类型。
网络安全能力方面,Anthropic 称并没有专门训练 Sonnet 5 做高风险网络安全任务。它能完成一些常规、无害的网络安全工作,但在危险能力评测中,明显弱于 Opus 4.8 和 Mythos 5。
对涉及大规模数据和敏感数据的科研场景来说,一个关键卖点是数据可以留在实验室已有基础设施上,只有每一步分析所需的上下文会发送给 Claude。
即日起到 2026 年 8 月 31 日,Claude Sonnet 5 在 API 上的输入价格为每百万 tokens 2 美元,输出价格为每百万 tokens 10 美元。9 月 1 日后,标准价格恢复到输入每百万 tokens 3 美元、输出每百万 tokens 15 美元。
放在产品线上看,Sonnet 5 是一次常规升级。放在 Anthropic 眼下的时间点看,它更像是一张递给开发者、企业客户和 IPO 市场的答卷。
科学研究里有大量琐碎工作。
Anthropic 还会支持最多 50 个 Claude Science AI for Science 项目,每个项目最高提供 3 万美元 credits,Modal 也会为部分项目提供最高 2000 美元算力支持,申请截止到 2026 年 7 月 15 日。
具体而言,UCSF Brain Tumor Center 的 Stephen Francis 则用它加速胶质瘤分子流行病学研究,称部分分析时间被压缩到原来的十分之一左右。
今年 2 月,Anthropic 以约 3800 亿美元估值完成 300 亿美元融资,年化收入约 140 亿美元。到 5 月底,Anthropic 又完成 650 亿美元 Series H 融资,投后估值达到 9650 亿美元,Altimeter Capital、Sequoia Capital 等机构参与领投。
前者,在过去一周,不少 Claude 用户早已见识过了。社交平台上关于 Anthropic 风控的讨论越来越离奇,从锁 IP、异地登录触发审查,到「不要随便打开 Anthropic 发来的邮件」的提醒,理由是邮件打开位置可能被用于判断账号所在地。
Anthropic 称,Sonnet 5 在推理、工具调用、编程和知识工作等方面,相比 Sonnet 4.6 有明显提升,整体能力接近 Opus 4.8,但价格更低。官方给出的定位也很明确:Opus 4.8 仍然适合追求更高准确率的任务,Sonnet 5 则提供一个成本更低、能力更接近高端模型的选择。
而 Sonnet 5 也好、Claude Science 也罢,一个面向开发者和企业生产流程,一个面向科研、生命科学和医疗相关研究。
能力之外,安全也是 Anthropic 这次发布的重点。
以 Firefox 147 漏洞利用评测为例,Sonnet 4.6 和 Sonnet 5 都没有成功写出完整可运行的 exploit,Sonnet 5 只是在部分成功率上略高于 Sonnet 4.6。Anthropic 以为,这更多来自模型通用能力提升,而非针对网络攻击能力做了专门训练。
Claude Science 想做的,就是把这些分散工具整合起来,让科学家可以在一个会话里完成文献分析、多步骤研究、图表生成、手稿修改和计算任务。
但过去一年,Anthropic 最明显的能力提升集中在 Opus 高端模型上。
帮忙写代码只是它的一个核心亮点,Anthropic 强调,Claude Science 生成的结果会带有可审计历史,包括图表背后的代码、运行环境、自然语言说明和完整消息记录。研究人员可以检查一个结果是怎么来的,也可以在几个月后重新复现。
从价格看,Anthropic 这次给了一个首发窗口期。
事实上,根据我的体验,Sonnet 5 表现也并未有肉眼可见的进步,反倒给我一种是打着 Agent 原生模型的旗号,却是为了省算力而急匆匆发布的即视感。
传闻细节仍有待核实,但 Claude 频繁封号已不争的事实。昨天一觉醒来,我也发现第五个 Claude 账号也被封了。
对 Anthropic 来说,IPO 叙事不能只停留在 Claude 很强。投资人真正关心的是:强模型能不能变成稳定收入;高收入背后的毛利率能不能站住;近万亿美元估值,能不能由企业客户、订单、API 使用量和专业场景长期支撑。
Anthropic 反复强调「成本和性能曲线」,原因也在这里。Sonnet 5 的重点,不是把 Opus 完全替换掉,而是让更多任务在更低成本下获得接近 Opus 的 agent 能力。
不过,Sonnet 5 的便宜并不完全等于,该花的账单会有一个断崖式的下降。
这恰逢 Anthropic 的 IPO 故事逐步清晰之际。
Claude 让人看见 AI 的能力上限,但殊不知,平台的下限也同样重要。犹高谈责任,真无耻之尤也。
究竟事情将如何发展,我们将持续跟踪报道。