AI 開發者生存報告：從 5.4 降智、代碼屎山到國產模型的「封與漲」

2026年4月16日

4月初，源头sonnet-4.6,gpt-5.4很明显的注水，降智。

连后台开发服务器都开不起来，还需要指导。

单一模块的mvp，确实sonnet几下就搞出来了，搭几个skill，像模像样的。

加上几个简单模块后，改了这里漏了那里，界面不统一，逻辑不统一。

这些其实不是bug，因为能运行啊，测试都能通过啊，但如果正常手写代码绝对不会这么干，一定是用比较懒的办法先统一了再说。

这种又蠢又累的打法，AI乐此不疲，高高兴兴的一轮又一轮的汇报改好了。

按聊天模式，如果自己不懂coding，根本不可能维护哪怕一个小项目。

试了不少spec相关工具，大部分失败了，非专业人士一步都进行不下去。

最后能用的用三个:planwithfiles, superpowers, getshitdone。

planwithfiles能写计划，记录进度，实现一个简易磁盘状态机。

superpowers能从头开始引导你构建一个项目，但写一点停一下，一个小项目写了3天还在打磨原型，只好放弃了。强是很强的，都能在web上展示给你看，让你做选择；用不了也是真用不了。

getshitdone真的是救命的稻草。discuss,plan,execute,verify，四步循环推进，从phase 1慢慢往上走到phase 2,3,4…能看见进度，能看懂在干什么，能产出成果。

适合我的打法：

gsd的作者还基于pi写了个gsd-2，从workflow升级为harness，有时间试试。

claude源代码泄漏，原来真的有100种方法封锁中国人，现在还能查身份证。

GGFFWW升级，大面积出不去，基本逻辑应该是嗅探订阅url，一网打尽。

美国封我们，我们封美国，真有意思。

现在国产能用的还是glm系列和qwen3.6plus，kimi,minimax,小米系都不行，我的判断标准是最简单的：能执行指令。

阿里停掉了40元的套餐，现在只有200元的pro，用不上了。

200元其实还是划算的，阿里给的量够大。qwen3.6plus确实注意力挺长的，能很好的执行指令。其他的能力未知。

小米mimo v2pro，39元最低的套餐，给了60M credits，折算30M tokens，估计只能用3小时。最高的套餐，659元/月，能用800M tokens。

一个连指令都不能很好执行的模型，价格是gpt5.4的4倍，deepseek的几十倍，只能说祝他大麦吧，咱是用不起。

结合GGFFWW升级，难道要封杀国外大模型，关起国门卖高价，回到邮箱一个月几十的荒诞时代。

国产模型几千亿市值，但是在cli里不能遵循AGENTS.md里的指令，也不能遵循用户输入的指令，模型的总负责人明显没有亲自使用过。

我感觉只要投入资金，叠出一个大模型已经不是难事，要打磨成好用的，还得靠A社这样的工程师文化。

阿里还会再次崛起。qwen3.5之前的失败是明显的，不够聪明，不够好用，只能在开源社区博个彩头，根本没人用来生产，甚至被国产小公司压制。拿下qwen负责人是明智的，负责人不服，离职了到处打嘴炮造势，明显是政治斗争高手不是工程师风格。现在3.6plus出来了，证明工程师回归，以后会越来越好。

智谱真是个神奇的公司，从4.7开始就能用，glm 5.1更是相当不错，可惜不支持视觉，不能视觉QA的大模型无法全自动工作。

截至目前，多模态编程大模型能用的，还只有Qwen3.6plus一个。