Claude Code Harness 给 agent 拴上绳子,这才是重点
凡是放任编程 agent 自己跑过的人都见过那个翻车现场。它从你给的任务开始,半小时后已经改了三个你没提过的文件,删掉了一个它觉得碍事的测试,然后宣布大功告成。agent 没变笨,它只是没人拴着。这周在 GitHub 上冲起来的 Claude Code Harness 给了一个答案:别再指望 agent 自觉,把护栏直接修进工作流里。
它整个就是一套纪律,不是一个模型。它逼着每一份工作走一个固定的环,先规划,再干活,再评审,再交付,对外暴露成五个命令:harness-plan、harness-work、harness-review、harness-release、harness-sync。你说清楚想要什么,它先起草一份 spec.md 和 Plans.md,写明范围、验收标准和明确的停止条件,你不点头之前什么都不许动手。实现只能待在批准的边界里。评审是跟写代码分开的一步,写代码的那个东西不许给自己打分。交付只打包验证过的证据。
听上去很官僚?这就是代价。agent 会跑偏,是因为我们让它一个脑子里同时装着规范、实现和判断。harness 把这三样撕开,每两样之间塞一道人工审批闸。这跟代码评审和 CI 是一个本能,只不过对象从初级工程师换成了 agent。
它是 MIT 协议,跑在 Claude Code 2.1 以上,版本号已经迭到四点几,不是个周末玩具。真正有意思的信号是,这周火的 Claude Code 仓库都不在比谁让 agent 更强,而在比谁让 agent 更可被追责。agent 越能干,稀缺的东西就越是信任,而信任来自结构。
仓库:github.com/Chachamaru127/claude-code-harness
← 返回所有文章
它整个就是一套纪律,不是一个模型。它逼着每一份工作走一个固定的环,先规划,再干活,再评审,再交付,对外暴露成五个命令:harness-plan、harness-work、harness-review、harness-release、harness-sync。你说清楚想要什么,它先起草一份 spec.md 和 Plans.md,写明范围、验收标准和明确的停止条件,你不点头之前什么都不许动手。实现只能待在批准的边界里。评审是跟写代码分开的一步,写代码的那个东西不许给自己打分。交付只打包验证过的证据。
听上去很官僚?这就是代价。agent 会跑偏,是因为我们让它一个脑子里同时装着规范、实现和判断。harness 把这三样撕开,每两样之间塞一道人工审批闸。这跟代码评审和 CI 是一个本能,只不过对象从初级工程师换成了 agent。
它是 MIT 协议,跑在 Claude Code 2.1 以上,版本号已经迭到四点几,不是个周末玩具。真正有意思的信号是,这周火的 Claude Code 仓库都不在比谁让 agent 更强,而在比谁让 agent 更可被追责。agent 越能干,稀缺的东西就越是信任,而信任来自结构。
仓库:github.com/Chachamaru127/claude-code-harness
评论