AI Agent、Vibe Coding与生活使用
在 2026 年,
随着推理模型的一步步发展,现在的写代码似乎越来越轻松了。
我日常不需要怎么写代码,总觉得现在的大模型已经越来越逼近顶尖人类的能力。现在 agent 框架已经可以完整实现写代码,获取代码执行结果的反馈,不断修正,最后逼近使用者的目标的效果。
在 2025 年 7 月,我第一次使用了这样的工具。我尝试的不是现在(2026 年 4 月)非常流行的 claude code 等工具,当时我使用的是 Google 的 Gemini CLI,因为,当时铺天盖地的新闻就是,gemini cli 免费了。当时恰巧我白嫖了 gemini 的一个 pro 账号,于是就下载下来使用。但是当时不是很顺利,gemini cli 对网络的要求特别严格,得开启魔法上网的隧道模式才行(TUN)。即便搞定了网络问题,但是此时的模型的智力还是 gemini 2.5 pro 的时代,我用之前的一个比赛的赛题进行测试,它没有做对其中任何一道题。查找一番原因,由于当时的使用人数太多,Google 偷偷替换了模型,将 pro 模型换成了 flash 模型
![[Pasted image 20260421195119.png]]
当然,现在的 gemini 也是很难登录上去(2026.4)
![[Pasted image 20260421195736.png]]
更新了之后,变得好看多了,但是我的 pro 资格已经消失不见
直到 2025 年 11 月,我才开始使用 claude code。此时,我面临繁重的学业任务。一周的课程数量巨大,非常不幸的是,几乎每堂课都要进行课堂展示,需要制作大量的 ppt,还要写大量的数据清洗和回归代码。(有些课堂需要用数据进行实证分析,就是跑回归分析)如果只靠传统的手写代码或者是使用网页版的 ai 问答,这样的学业任务肯定是完不成的。于是我开始使用了 claude code。
我一开始对他是不报什么期待的,我甚至以为他能帮我生成演讲的 latex beamer 的 tex 源码我自己修改就行了。但是事实上 claude sonnet 4.5 的智力程度超乎了我的想象,在处理这些简单任务上,它几乎是一次搞定,不需要人来干预。
后来就是 openclaw爆火的事件了。但是我不认为 openclaw 有任何优于 claude or codex 的地方,与之相反,它的 token 使用效率极低,如果 openclaw 能完成的事,codex 和 claude 能比它完成得更好,且花费更少的 token。