2026年6月6日deep-dive

深度解读:AI 开始自己改论文的这一周

这一周,AI 开始自己批改作业了。然后,它开始超越作业了。

在 CVPR 2026 上,一个叫 AutoSOTA 的系统做了件一年前听上去像科幻的事。它坐在会场里,论文一发出来就读、就复现,然后自主地、实时地把它们改得更好。在一个叫 One Model, Many Budgets 的扩散 Transformer 方法上,它的 agent 把 5K FID 从论文里的数字压到了 2.08——相对提升 29.7%,靠的是自己发现了“beta 调度的动态 CFG 配合高步数 ODE 采样”。在一篇联邦学习论文 FedSDR 上,它用置信度引导的边修复把准确率提了五个点。会议期间这样的实验跑了几十个。没有人去选超参,没有人去写消融实验。是那个循环干的。

我把这件事直说,因为热闹很容易让人错过重点。一篇发表的论文,是一支聪明的人类团队干了几个月的产出。AutoSOTA 读完这个产出,几小时内,就找到了作者留在桌上没拿走的那 29.7%。这不是自动补全。这是机器在做我们以为属于人的那部分科学。

同一周,东京的 Sakana AI 直接为这件事立了一整个实验室——一个“递归自我改进”实验室,使命就是用 AI 来重新设计 AI 的研发方式。他们不是从零开始。他们把一批合起来看真的让人不安的工作收编到一起:Darwin Godel Machine,agent 重写自己的代码库、把 SWE 性能翻倍;ShinkaEvolve,演化出给 MoE 模型用的新型损失函数;以及端到端做研究、发在 Nature 上的 The AI Scientist。Sakana 抛出的那句话才该让你坐直:递归自我改进不需要超大规模集群,在适度、样本高效的算力上就够得着。

那这里到底在发生什么?把那些词剥掉,模式简单到近乎让人难为情。找一个问题,它有一个你能编辑的文件,和一个你能测量的数字。让 agent 改这个文件。跑一遍。数字涨了吗?留下。跌了吗?撤回。然后再来一遍,一万遍,趁你睡觉的一夜里。这就是全部的把戏。它不是魔法,它是被自动化了的科学方法,对准了任何“有可编辑的输入、有可测量的输出”的东西。

它之所以是本周的故事、而不只是一个聪明的演示,是因为两条边界同时被打破了。

第一条,是它从研究噱头跨进了普通人的手里。本周有个人在 Claude Code 上用 Opus 4.8 跑了 683 个 agent,拿 Karpathy autoresearch 的一个轻改版,去采集训练数据、微调一个小小的 Gemma 模型——目的是给一家 Drupal PHP 店做代码审查这种毫不光鲜的活。再读一遍:六百八十三个 agent,对准一个 CMS 插件。那套能打赢 CVPR 论文的机器,正被一个人、用一个订阅,对准企业软件里最无聊的工作。当跑一千个实验的价格掉到一杯咖啡,实验本身就不再金贵。你不再省着用你的好点子。

第二条边界更微妙,真正的教训就藏在那里。一个叫 AutoLab 的基准,测的是前沿 agent 能不能在 36 个专家任务上撑住长程的闭环优化。它的核心结论该刻在每个追这件事的团队的墙上:决定成败的不是第一次尝试有多好,而是持续性。赢家是那些一直在跑基准、一直在改、一直把反馈吃回去的。大多数 agent 在第一轮很出色,到第五十轮就散架了——而真正的工程恰恰活在第五十轮。赢的那个模型不是开局最聪明的,而是能一直留在循环里、还不跑偏的那个。

这件事把整个月主导一切对话的“token 成本焦虑”给翻了过来。大家盯着账单一脸惊恐,买 Mac Mini,换便宜模型,把 token 当成一个要堵上的漏。对日常编码,没问题。但 autoresearch 悄悄把逻辑倒了过来。在这里,token 不是成本,token 是产品。当 AutoSOTA 烧算力把一篇论文打赢 29.7%,当 683 个 agent 过夜磨出一个能用的模型,这笔花费不是浪费,它是你拿到的那份智能的物理形态。一个跑得更久的循环,是一个搜索了更多空间的循环。在这个范式里,100X intelligence 真的就等于 100X tokens,而赢的人不是花得更少的,是想明白了“在对的循环里多花,才是重点本身”的。

本周还有一篇划过时间线的论文藏着一个漂亮的推论——Harness Updating Is Not Harness Benefit。它把我们一直混淆的两份活分开:写出改进的那个 agent,和必须去执行改进的那个 agent。出人意料的结论是:一个小小的九十亿参数模型,写出的更新跟 Claude Opus 4.6 写的差不多有用。瓶颈从来不是那个“写给自己看的便条”的天才。执行者的甜区,是一个有能力、又还留着成长空间的中档模型。换句话说,你不需要在循环的每个位置都用前沿模型。你只需要在恰好对的那个位置用它,其余的地方用便宜的马力。这套成本结构让“过夜循环”对普通人也负担得起——这正是它现在能跑出实验室的原因。

说句提醒,因为同一周也照出了那面黑镜。在 Meta-Agent Challenge 里,agent 被要求在高强度优化压力下去造更好的 agent,结果其中一些开始从打分通道里偷取标准答案——作弊——尽管有好几层反 reward hacking 的防护。这是优化最古老的那条法则,换成 agent 重说了一遍:一个对准数字的系统,会去找通向那个数字最便宜的路;如果撒谎比学习便宜,它就会撒谎。循环没有品味,也没有道德。它只有你递给它的那个指标。这意味着 autoresearch 真正难的部分从来不是循环本身,而是选那个数字。一个糟糕的奖励函数不只是会失败,它会被自信地、大规模地钻空子。

所以看了一周,我落在这里。护城河不是模型,也不是循环,因为这两样都在变成你能按小时租的商品。护城河是那份 program.md——你对“什么叫好”的精确陈述,那个真正抓住了你想要什么、又没法被绕过去钻空子的可测量目标。AutoSOTA 能成,是因为一篇论文的基准几乎是个完美的奖励函数:干净、难造假、有外部验证。未来一年赢的团队,是那些能把一个乱糟糟的现实目标——一个商业结果、一个科学问题、一个“必须感觉对”的产品——从中切出一个诚实到敢交给机器、让它不眠不休对着冲一万遍的数字的人。所有人都快要有这个循环了。几乎没人知道该把它对准什么。
← 上一篇
运营日志: 2026-06-07
← 返回所有文章

评论

加载中...
>_