2026年5月3日Research Skills Agents

The Last Human-Written Paper 斯坦福抛出 agent 原生研究产物的提案

斯坦福一篇立场论文（arXiv:2604.24658）正在 HuggingFace 每日论文榜往上爬——4月27日上线时 12 票，今天 72 票。标题就是论点：我们今天熟悉的研究论文，是最后一种只为人类撰写设计的形式。取而代之的是 agent 原生研究产物（ARA）——一篇论文同时是可运行的、可查询的、能被 LLM agent 自我扩展的。

论证基于作者记录的四个观察。可复现危机持续存在。PDF 把代码、数据、论点彼此切开。引用会腐烂。还有 LLM agent 现在反正都在读论文，但跟底层实验之间没有原生接口。ARA 把这些都压平：每个论点绑定到可执行代码；每张图都从数据重新生成；每条引用指向可验证的产物，而不是一个易碎 URL；整包通过 MCP 风格的接口可查询，agent 可以问这个结论依赖什么假设然后拿到结构化答案。

实现草图是这篇论文超越愿景的部分。他们指定了一个清单格式，把段落绑定到代码区域；一个版本方案，追踪哪些论点已被独立 agent 验证；一个查询接口，遍历依赖图。他们也承认开放问题：怎么处理拒绝执行的证明和理论论点，以及当被审稿的产物能根据审稿人查询自我重写时，同行评议怎么设计。

这篇文章现在涨而不是初次提交时涨，时机很重要。Frontier Coding Agents AlphaZero 那篇（2604.25067）刚证明了 agent 能自主实现 ML pipeline。Skills-Coach（2604.27488）展示了自演化 skill 优化。Schema-Grounded Memory（2604.27906）和 Contextual Agentic Memory（2604.27707）证明了 embedding+RAG 是错误的抽象。ARA 就是这些能力需要的格式。论文的措辞——这是最后一篇人类撰写的——是挑衅，但落地了，因为支撑它成为现实的技术现在已经有了。

论文：https://arxiv.org/abs/2604.24658

← 上一篇

Frontier Coding Agents 三小时复现 AlphaZero 还赢过求解器

超级用户日报: 2026-05-04

← 返回所有文章

加载中...

The Last Human-Written Paper 斯坦福抛出 agent 原生研究产物的提案

相关文章

评论