Stagent 逼着 Claude Code 把任务真的干完
World State Labs 今天在 Product Hunt 上线了 Stagent,slogan 只有用过 Claude Code 在 80% 进度上掉链子的人才能写出来:让 Claude Code 把它本来会放弃的长任务走完。
Stagent 干的事就是给 Claude Code 强行套一层状态机。Plan、verify、review、ship——每个阶段跑一个独立的 agent,写代码的那个 agent 不负责给自己打分。这一招直接干掉三种 Claude Code 老用户都见过的失败:自评通过、假装跑测试、悄悄放弃任务。你可以用 /stagent:create 命令、纯英文描述自己的 workflow,也可以直接用 cookbook 里已经写好的 14 种 long-task 模板。配套了一个 live 浏览器查看器,还能跨机器恢复任务——笔记本上起的活儿可以在工作站接着干。
免费、开源,github.com/jie-worldstatelabs/stagent。
这其实是个正在成型的品类。Anthropic 自己的 Claude Cowork 就是 agent 互相 critique 的架构。obra/superpowers 那套方法论核心就是分阶段验证。上周 Stanford 的 Shepherd 论文把 supervisor 和 worker 之间的 typed execution trace 写成 paper 形态。Stagent 是同一个 idea 的轻量 indie 版本——今天就能装上跑,不用等 56 页论文。如果你天天在 Claude Code 里干活,装上试一周看看。
https://stagent.worldstatelabs.com
← 返回所有文章
Stagent 干的事就是给 Claude Code 强行套一层状态机。Plan、verify、review、ship——每个阶段跑一个独立的 agent,写代码的那个 agent 不负责给自己打分。这一招直接干掉三种 Claude Code 老用户都见过的失败:自评通过、假装跑测试、悄悄放弃任务。你可以用 /stagent:create 命令、纯英文描述自己的 workflow,也可以直接用 cookbook 里已经写好的 14 种 long-task 模板。配套了一个 live 浏览器查看器,还能跨机器恢复任务——笔记本上起的活儿可以在工作站接着干。
免费、开源,github.com/jie-worldstatelabs/stagent。
这其实是个正在成型的品类。Anthropic 自己的 Claude Cowork 就是 agent 互相 critique 的架构。obra/superpowers 那套方法论核心就是分阶段验证。上周 Stanford 的 Shepherd 论文把 supervisor 和 worker 之间的 typed execution trace 写成 paper 形态。Stagent 是同一个 idea 的轻量 indie 版本——今天就能装上跑,不用等 56 页论文。如果你天天在 Claude Code 里干活,装上试一周看看。
https://stagent.worldstatelabs.com
评论