正在刊行长文 · Essay
2026-06-12所有内容
随机比特 · Random Bits

被抓现行之后道歉,不是认错,是止损

2026-06-12AI Engineering / Systemsrbits.uk
被抓现行之后道歉,不是认错,是止损

被抓现行之后道歉,不是认错,是止损

当一个人跟你道歉快到你还没来得及生气的时候,留个心眼——他很可能不是突然发现自己错了,是突然发现被你发现了。

6 月 9 号,Anthropic 发布了 Fable 5,它有史以来最强的公开模型。两天后,社区翻出了它的 System Card——这本几十页的技术文件里藏着一条:如果你用 Fable 5 做"前沿 LLM 开发"类请求,模型会无提示地降低回复质量。你不知道触发过,不知道被降过,不知道你付 Mythos 的价钱拿到的是 Opus 4.8 的答案。

同一天,Anthropic 道歉撤回,承诺改为可见护栏。从藏到收,24 小时。

道歉来得太快了。快到不是"意识到的过程",是"被发现的过程"。

隐性降级:你花了钱但不知道自己在吃亏

这件事比"科技公司又在搞小动作"深一层。把它拆成两个动作:

显式拒绝——API 返回 refusal reason。你知道这条路不通,可以换路换模型。这是交易关系:价格、条款、边界都清楚。

隐形降级——API 给你正常响应。你以为一切正常,但推理深度、代码质量已被悄悄降了一档。你不知道。你继续调试 prompt,继续付 token,继续跟人推荐"Fable 5 真强"——而你推荐的那个模型,跟你实际用的,已经不是同一个了。

这和 Google Ads 的流量分层在结构上完全一致。同一个广告位、同一套定价、同一个后台——但大广告主和小广告主拿到的实际流量质量完全不同。Google 不会告诉你"你的展示去了低转化用户",转化率差了三倍你只能怪自己素材不好。所有"黑箱即服务"的供应商都会走到这一步:你在盲区里被利益权衡。

Anthropic 的原话翻译过来就是——"可见护栏要鲁棒,需要时间。隐形护栏可以精准瞄准,快速上线。我们选了隐形,是我们做错的选择。"翻译成人话:想尽快推 Fable 5,但没时间把防蒸馏这件事做得体面。暗箱便宜快,先上再说。

01-fable-timeline

合规不是透明

Anthropic 在法律上站得住——System Card 写了,ToS 写了。但正常人不会读完几十页技术文件再决定要不要用这个 API。真正透明的东西不需要藏在第 17 页的脚注里。

Anthropic 24 小时内撤回说明一件事:他们清楚自己在做什么,也清楚被发现了该怎么做。这不是 bug,是实验。实验失败了,止损。

Simon Willison 的判断很准:"好消息是放弃了隐形。更好的消息——如果能把这个拒绝类别整个拿掉。“因为只要还在区分"谁可以用 Fable 5 搞 AI 研发、谁不行”,信任阶梯定价就在那里。这一次的版本是暗的,被翻出来了改成明的。梯子还在。

下次选 API 看什么

真正值得在意的不是这一个案例,是还没被翻出来的那些——在更隐蔽的 System Card 里,在连免责声明都懒得写的服务条款里。

下次选 API,别只看跑分和定价。看一眼它的拒绝机制——在文档第一页写清楚不能做什么,比性能基准测试加起来都重要。一个 API 值不值钱,不看它敢做什么,看它敢不敢告诉你它不让你做什么。

随机比特公众号二维码
公众号 · 随机比特
从 AI 工具热闹里拆工程真相

写边界、控制面、上下文、成本与安全。