向左,向右?
我们似乎迈入了一个新的拐点,可预见的是, AI 正在重塑一切。在我之前的25年的年终总结里,我已经提到了自己彻底拥抱了 AI。
我手动写代码的次数越来越少了,在 OpenClaw 风靡之后,我也从零开始做自己的自举机器人,研究了 bub 还有 pi-mono 等一些优秀项目的源代码,就像最初在朋友圈思考那一样,
OpenClaw 火了之后,我也开始尝试从零开始做自己的自举机器人,看着它学会发语音 发表情 开始写 PR,自己接入我的 todo 软件,看起来是像进化越来越聪明了,但是渐渐的就会进入瓶颈期变得没有那么聪明,每次我升级了一次框架它就会再次进入新的循环 越来越聪明然后陷入一个瓶颈期。 我在想框架有可能让它突破本身模型能力的上限不断进化还是只能作为模型能力的放大器,如果是后者的话,我一开始就应该选择最聪明的模型…
随着我不断的尝试,我在思考 Agent 的走向应该是走一条自己的路,还是去模仿人脑,期间读了重新发明打孔纸带 (bub的核心) ,我最终选择了往人脑的方向去靠近。框架取名为 kuafu,也是向这些优秀框架的和文章的作者致敬。
Kuafu 是一个通道无关的运行时内核,只负责“执行循环 + 工具调用 + 记忆持久化”。
核心流程是一个固定的 FSM:
- Perception:组装上下文、路由技能、准备输入。
- Thinking:调用模型得到结构化输出。
- Decision:规则和安全检查,决定继续或停止。
- Action:执行工具或技能(builtin + SKILL.md)。
- Reflection:可选复盘与经验写入。
所有历史与向量检索都落在 Store (SQLite + vec),由内核统一读写。
Kuafu 形式上像人类思考流程,但本质是可控的工程执行流程, 先理解、再思考、再决定、再行动、再复盘。
当执行一个任务的时候,Agent 可能会尝试很多种方法,每种方法都是一个分叉,当其中一个分叉走到了死胡同,那它就会带着失败的教训回到起点,开始另外一个分叉,直到任务完成或者走到下一个分叉。设计初期,只保留了失败的教训,后来连成功的经验也一并保存了下来,负向和正向都是宝贵的经验对人类来说。不过可能本质还是一个打孔纸带,就和 Psiace 在文章提到的那样子 Agent 并不真的分叉。
进一步
和我的截图那样子,我尝试把我电脑中各种 CLI 的工具,一开始我把 kuafa + telegram 统统放到沙盒,然后使用 kimi 2 ,接入多路由模式,通过小模型 gpt-4o-mini 来做路由决策,也尝试了其他大模型,感觉效果不是很理想。模型能力强不强一个很直观的感受就是它对指令的遵守程度。
后来跑了一段时间,架构改了几次,决定把它一定程度上从沙盒里放出来,我建立了一个 Bridge,让它可以调用我电脑里的 codex 以及其他的 cli 工具。初期也只是单 agent 去执行,后来几个 cli 都接入了,那就试着多 agent 模式,让一个 agent 去写代码,另外一个去 review,效果感觉还行。
ToastPlan 的接入
ToastPlan 是我一直在做的 OKR 软件,一个是管理自己,另外一个是管理 AI,可以让 AI 更新它们自己的任务,方便我追踪,图形化的软件其实只是给人类使用的,当然也是我后续对 Agent 优化的一个参考指标。
展望
我还在做的另外一个软件 — 阅读器,后面也准备让 AI 可以拉取我的阅读清单,以及后面准备再写一个写作软件,这样子的话,我只需要一个常开的主机,然后无尽的 token 就可以把很多事情都做了。What you see,what you do, and how you think shape who you are.
AI 时代让有的人放弃了写作,也有人充满了干劲。我也曾因为 AI 剥夺写代码的乐趣困恼过,也焦虑过,后来我才意识到,不是写代码让我快乐,而是创造。AI 本质不是改变什么,而是加速,只是让一切的进程加快了而已。