OpenClaw+Codex:一人团队如何替代整个开发团队
前几天刷到个帖子,给我看傻了。
一个开发老哥,用 AI 智能体集群,一个人干了整支开发团队的活。不是 Demo,不是 toy project,是正经在跑的 B2B SaaS,还在产生真实收入。
这数据太离谱了
单日最高 94 次代码提交,日常平均 50 次。
最快 30 分钟合并 7 个 PR,需求从提出到上线通常当天搞定。
关键是,这些代码直接变成真金白银的 经常性收入。
整套系统跑下来,月均成本 190 美元,最低 20 美元就能起步。
这哥们儿叫 Elvis,已经把架构开源了。核心是个叫 OpenClaw 的智能体编排系统。
核心痛点:上下文窗口不够装
直接拿 Codex 或 Claude Code 写代码?那是老黄历了。
问题在于上下文窗口的零和博弈——代码塞多了,业务逻辑装不下;塞满客户历史,又看不懂代码库。
就像拿个小杯子装东西,代码和业务背景只能二选一,怎么都不够使。
破局的关键是:把业务跟代码解耦。
OpenClaw 是干嘛的
简单说,它是人和大模型之间的”翻译官”。
这个编排器叫 Zoe,直接读 Obsidian 里的客户数据、会议记录、历史决策,把业务上下文翻译成机器能懂的提示词。
有意思的是,这跟 Stripe 之前披露的 Minions 系统思路很像,但完全跑在本地。
工作流:极度克制的自动化
需求确定后,Zoe 干这几件事:
- 调管理员 API 解除客户限制
- 拉生产数据库的只读配置塞进提示词
- 给每个智能体分配独立的 git worktree 和 tmux 会话
1 | git worktree add ../feat-custom-templates -b feat/custom-templates origin/main |
然后唤醒编码智能体:
1 | codex --model gpt-5.3-codex \ |
tmux 这个用法挺妙
发现方向偏了,不用杀进程,直接往终端发指令强行纠偏:
1 | tmux send-keys -t codex-templates "Stop. Focus on the API layer first, not the UI." Enter |
任务状态实时写进 .clawdbot/active-tasks.json:
1 | { |
跑完自动更新:
1 | { |
监控:低成本轮询
用 cron 每 10 分钟跑一次确定性 Shell 脚本。
.clawdbot/check-agents.sh 检查会话状态、调 gh cli 验证 CI,卡住了自动重试最多 3 次。
代码提交门槛很高:TypeScript 检查、单元测试、Playwright 端到端测试,一个都不能少。UI 改动还必须带截图,否则 CI 直接拦下。
Code Review:三模型交叉验证
这套审查机制挺有意思:
- Codex:抓逻辑错误、竞态条件这些核心坑
- Gemini:盯安全漏洞和架构扩展性
- Claude Code:打辅助,做冗余验证
三个模型互相盯着,比单一模型靠谱多了。
改良版拉尔夫循环
底层跑的是改良版拉尔夫循环。
Zoe 不是机械地复用静态提示词,而是带着全局业务上下文去救场,动态调优失败的节点。
更狠的是,它还能自己找活干:
- 早上扫 Sentry 日志,自动派修复工单
- 开完会解析记录,提取功能需求
- 晚上梳理 git 日志,生成更新文档
基本不用人催,自己就把活儿干了。
模型分工很明确
不同模型干不同的事,不瞎折腾:
- Codex:90% 的复杂后端和跨文件重构
- Claude Code:前端构建和 git 操作
- Gemini:UI 设计环节输出规范文档
各干各的擅长的,效率最高。
部署:10 分钟搞定
最爽的是部署。把架构文档扔给 OpenClaw,10 分钟 内全自动完成脚本生成和目录搭建。
基本上就是”一键开店”的感觉。
唯一的瓶颈:内存
现在卡脖子的只有硬件内存。
每个独立工作树加并发编译环境,都在疯狂吃内存。
16GB 的 Mac mini 并发 4-5 个智能体就开始Swap了。
老哥已经下单了 3500 美元的 M4 Max Mac Studio(128GB 内存),准备突破并发上限。
一人公司时代真要来了
基于这套系统做的公关工具 Medialyst.ai 已经在落地。
不是概念验证,是真的在赚钱的一人企业。
我的一点想法
说实话,这事儿给我的震撼挺大的。
不是那种”AI 好牛逼”的震撼,而是”原来真的可以这么干”的震撼。
单人开发团队不是空谈,已经有人跑通了。关键不是某个模型多强,而是怎么让多个模型协同起来。
OpenClaw + Codex/CC 这个组合,给了一个很清晰的方向:
编排比模型本身更重要。
传统软件开发那套流程正在被重塑。以前需要产品经理、开发、测试、运维一堆人干的事,现在一个人加一堆智能体就能搞定。
一人公司的时代,可能比我们想象的来得更快。