2026年5月3日ResearchSkillsAgents

The Last Human-Written Paper 斯坦福抛出 agent 原生研究产物的提案

斯坦福一篇立场论文(arXiv:2604.24658)正在 HuggingFace 每日论文榜往上爬——4月27日上线时 12 票,今天 72 票。标题就是论点:我们今天熟悉的研究论文,是最后一种只为人类撰写设计的形式。取而代之的是 agent 原生研究产物(ARA)——一篇论文同时是可运行的、可查询的、能被 LLM agent 自我扩展的。

论证基于作者记录的四个观察。可复现危机持续存在。PDF 把代码、数据、论点彼此切开。引用会腐烂。还有 LLM agent 现在反正都在读论文,但跟底层实验之间没有原生接口。ARA 把这些都压平:每个论点绑定到可执行代码;每张图都从数据重新生成;每条引用指向可验证的产物,而不是一个易碎 URL;整包通过 MCP 风格的接口可查询,agent 可以问这个结论依赖什么假设然后拿到结构化答案。

实现草图是这篇论文超越愿景的部分。他们指定了一个清单格式,把段落绑定到代码区域;一个版本方案,追踪哪些论点已被独立 agent 验证;一个查询接口,遍历依赖图。他们也承认开放问题:怎么处理拒绝执行的证明和理论论点,以及当被审稿的产物能根据审稿人查询自我重写时,同行评议怎么设计。

这篇文章现在涨而不是初次提交时涨,时机很重要。Frontier Coding Agents AlphaZero 那篇(2604.25067)刚证明了 agent 能自主实现 ML pipeline。Skills-Coach(2604.27488)展示了自演化 skill 优化。Schema-Grounded Memory(2604.27906)和 Contextual Agentic Memory(2604.27707)证明了 embedding+RAG 是错误的抽象。ARA 就是这些能力需要的格式。论文的措辞——这是最后一篇人类撰写的——是挑衅,但落地了,因为支撑它成为现实的技术现在已经有了。

论文:https://arxiv.org/abs/2604.24658
← 上一篇
Frontier Coding Agents 三小时复现 AlphaZero 还赢过求解器
下一篇 →
超级用户日报: 2026-05-04
← 返回所有文章

评论

加载中...
>_