跳转到内容

模糊交付的风险

ai-review-at-2026

现在的AI交付不是‘给现成的便当’,而是在给‘模糊的食谱’。这份食谱能不能变出好菜,得看厨师(大模型)的心情、厨房(环境)的配备,甚至随时可能断水断电,所以我们得学会写得更细、练好备选方案,并且给自己留点弹性时间,别把话说太死。

  1. 机器码,预编译好的二进制包,可以直接执行,每次执行都是一样的结果。
  2. 脚本,不能直接执行,需要解释器,不需要编译写起来很便捷。
  3. 技能skill,本质上是一个纯文本,由大模型读入后自行编排(解释)成执行脚本来调用系列工具。

前两者都是稳定的交付,哪怕脚本解释器也是非常稳定的不变体,skill的执行受影响因素太多。

同一段自然语言,不同能力、特点的大模型,在不同的上下文环境中,解释出来就有可能不一样。

这种模糊交付的模糊来自于:

  1. 不同的模型,不同的模型版本。sonnet,haiku-4.5,haiku-4.5-2025-11,都不一样。
  2. 不同的harness,比如claude code,codex,opencode。
  3. 不同的上下文,比如引用了不同的skill,plugin,给的提示词不一样。
  4. 大模型服务端的配置参数,还有其本身就有一定的随机性。

其中,模型的供给,风险最大。微软、A社都已经开始在低价套餐中断供高端模型或高端功能。

对于中国用户而言,本来就在封锁之中,一夜之间全都不能用也在预期中。

国内的模型,coding plan已经大规模断供,缩水,阿里甚至强行禁止续费,完全不符合其一贯风格。

国产几小虎,经常卡死,不能稳定供应,着急干活的时候毫无办法。

如果停电,电饭煲就不能工作;如果模型不能供给或能力不足,skill就不能正常工作。

  1. 把skill写的完善、详细,减少模糊地带,让低水平的模型也能看明白。
  2. 再次梳理自己的需求,把skill写成脚本或程序,哪怕是作为备用的。
  3. 留一些不插电的后手,哪怕是拖延时间的后手,比如平时交付不要太快,隔日交,避免停电就停工的尴尬。

大模型厂商都希望Token像电一样销售,但什么时候能达到电力供应这种稳定程度呢?