2026年7月3日MonitoringToolAgents

Retrace:agent终于有了真正的调试器

今天调试一个agent,基本靠重跑一遍然后祈祷它用同样的方式挂掉。它不会的——这正是全部问题所在。本周在Product Hunt上线的Retrace是一个agent执行回放引擎:把一次运行里的每个LLM调用、每次工具执行、每个报错都录下来,然后可以确定性地回放,从出问题的那一步fork出去,改掉输入,把下游整条链路级联重放。两条时间线并排diff,连成本和延迟的差值都给你,让你能证明修复真的修好了,而不是碰巧过了一次。

产品的另一半是运行时策略:成本预算、死循环检测、context溢出和延迟上限。越线的瞬间agent收到一条HALT指令——失控的循环停在你的预算线上,而不是停在信用卡额度上。框架无关,LangChain、CrewAI、Vercel AI SDK、AutoGen、LlamaIndex都能接。

这和研究端一直在喊的事严丝合缝。Agents' Last Exam证明agent在大部分真实任务上会挂;Agentic Abstention那篇论文证明最贵的失败模式不是答错,是不知道该停。录制—回放—fork是我们当年承认分布式系统不确定之后发明的调试方法,现在轮到agent享受同样待遇了,而且早就该来了。

可观测性这个赛道已经很挤:Heron在网络层抓包,Coralogix花两亿美元入场,十几个SDK埋点工具在卷。Retrace的差异点在于它不是仪表盘,是调试器——你不是盯着agent看,是把它倒带。要真正修问题,这才是对的抽象。

https://retraceai.tech
← 上一篇
RL后训练可能只需要练一层
下一篇 →
超级用户日报: 2026年7月3日
← 返回所有文章

评论

加载中...
>_