Judgment Labs 融资 3200 万美元,把 agent 生产数据变成持续改进
Judgment Labs 宣布完成 3200 万美元种子加 A 轮合并融资,两轮都是 Lightspeed 领投。Nova Global、SV Angel、Valor Equity、Dynamic 跟投。Lightspeed 在 6 个月内追投,没等到任何外部压力就主动加注,这个信号很响。
Judgment 做的是 agent 圈最不性感但最难的活。任何一个把 agent 推上生产的团队都会撞到同一堵墙:轨迹很长、工具调用爆炸、记忆变来变去,凌晨 3 点出问题的时候你根本没办法快速找到故障模式。Judgment 把轨迹索引起来,让工程师像查日志一样查 agent 行为,用一群 agent judge 去 triage 失败用例,提出修复方案后还能在真实生产场景上回放验证,确认无误再上线。
他们的研究栈起了名字:Agent Search 做轨迹查询,Agent Judge 做低成本评估器,Behavior Discovery 挖失败模式,AutoRubrics 自动构造评估标准。Slack 直接集成,PM 和运维拉条 thread 就能调查用户投诉。定位很清楚:agent 的持续改进层。
三位创始人 22、23、23 岁。从小一起长大的发小。CEO Alex Shan 来自 Stanford NLP 实验室 Manning 组,首席科学家 Andrew Li 是 TogetherAI 早期研究员,CTO Joseph Camyre 在 Datadog 做大规模基建。他们押注的是 agent 栈的下一层不是单纯的可观测性,而是观测加改进。Datadog 那种「看日志」的位置已经定下来了,真正没定的是谁拥有「从生产轨迹到修好的 agent」这条闭环。Judgment 想占这个位置。
官网:https://www.judgmentlabs.ai/
← 返回所有文章
Judgment 做的是 agent 圈最不性感但最难的活。任何一个把 agent 推上生产的团队都会撞到同一堵墙:轨迹很长、工具调用爆炸、记忆变来变去,凌晨 3 点出问题的时候你根本没办法快速找到故障模式。Judgment 把轨迹索引起来,让工程师像查日志一样查 agent 行为,用一群 agent judge 去 triage 失败用例,提出修复方案后还能在真实生产场景上回放验证,确认无误再上线。
他们的研究栈起了名字:Agent Search 做轨迹查询,Agent Judge 做低成本评估器,Behavior Discovery 挖失败模式,AutoRubrics 自动构造评估标准。Slack 直接集成,PM 和运维拉条 thread 就能调查用户投诉。定位很清楚:agent 的持续改进层。
三位创始人 22、23、23 岁。从小一起长大的发小。CEO Alex Shan 来自 Stanford NLP 实验室 Manning 组,首席科学家 Andrew Li 是 TogetherAI 早期研究员,CTO Joseph Camyre 在 Datadog 做大规模基建。他们押注的是 agent 栈的下一层不是单纯的可观测性,而是观测加改进。Datadog 那种「看日志」的位置已经定下来了,真正没定的是谁拥有「从生产轨迹到修好的 agent」这条闭环。Judgment 想占这个位置。
官网:https://www.judgmentlabs.ai/
评论