AI 開發者生存報告:從 5.4 降智、代碼屎山到國產模型的「封與漲」
4月初,源头sonnet-4.6,gpt-5.4很明显的注水,降智。
连后台开发服务器都开不起来,还需要指导。
单一模块的mvp,确实sonnet几下就搞出来了,搭几个skill,像模像样的。
加上几个简单模块后,改了这里漏了那里,界面不统一,逻辑不统一。
这些其实不是bug,因为能运行啊,测试都能通过啊,但如果正常手写代码绝对不会这么干,一定是用比较懒的办法先统一了再说。
这种又蠢又累的打法,AI乐此不疲,高高兴兴的一轮又一轮的汇报改好了。
按聊天模式,如果自己不懂coding,根本不可能维护哪怕一个小项目。
试了不少spec相关工具,大部分失败了,非专业人士一步都进行不下去。
最后能用的用三个:planwithfiles, superpowers, getshitdone。
planwithfiles能写计划,记录进度,实现一个简易磁盘状态机。
superpowers能从头开始引导你构建一个项目,但写一点停一下,一个小项目写了3天还在打磨原型,只好放弃了。强是很强的,都能在web上展示给你看,让你做选择;用不了也是真用不了。
getshitdone真的是救命的稻草。discuss,plan,execute,verify,四步循环推进,从phase 1慢慢往上走到phase 2,3,4…能看见进度,能看懂在干什么,能产出成果。
适合我的打法:
- 迷你项目直接对话,用主子代理模式减少主线程上下文消耗,每个子代理都是新上下文新脑子;
- 小项目可以用planwithfiles;
- 正经需要维护的项目用gsd。
gsd的作者还基于pi写了个gsd-2,从workflow升级为harness,有时间试试。
claude源代码泄漏,原来真的有100种方法封锁中国人,现在还能查身份证。
GGFFWW升级,大面积出不去,基本逻辑应该是嗅探订阅url,一网打尽。
美国封我们,我们封美国,真有意思。
现在国产能用的还是glm系列和qwen3.6plus,kimi,minimax,小米系都不行,我的判断标准是最简单的:能执行指令。
阿里停掉了40元的套餐,现在只有200元的pro,用不上了。
200元其实还是划算的,阿里给的量够大。qwen3.6plus确实注意力挺长的,能很好的执行指令。其他的能力未知。
小米mimo v2pro,39元最低的套餐,给了60M credits,折算30M tokens,估计只能用3小时。最高的套餐,659元/月,能用800M tokens。
一个连指令都不能很好执行的模型,价格是gpt5.4的4倍,deepseek的几十倍,只能说祝他大麦吧,咱是用不起。
结合GGFFWW升级,难道要封杀国外大模型,关起国门卖高价,回到邮箱一个月几十的荒诞时代。
国产模型几千亿市值,但是在cli里不能遵循AGENTS.md里的指令,也不能遵循用户输入的指令,模型的总负责人明显没有亲自使用过。
我感觉只要投入资金,叠出一个大模型已经不是难事,要打磨成好用的,还得靠A社这样的工程师文化。
阿里还会再次崛起。qwen3.5之前的失败是明显的,不够聪明,不够好用,只能在开源社区博个彩头,根本没人用来生产,甚至被国产小公司压制。拿下qwen负责人是明智的,负责人不服,离职了到处打嘴炮造势,明显是政治斗争高手不是工程师风格。现在3.6plus出来了,证明工程师回归,以后会越来越好。
智谱真是个神奇的公司,从4.7开始就能用,glm 5.1更是相当不错,可惜不支持视觉,不能视觉QA的大模型无法全自动工作。
截至目前,多模态编程大模型能用的,还只有Qwen3.6plus一个。
Copyright © 2004-2026 WL