2026年6月7日deep-dive

深度解读：AI 开始自己改论文的这一周

这一周，AI 开始自己批改作业了。然后，它开始超越作业了。

在 CVPR 2026 上，一个叫 AutoSOTA 的系统做了件一年前听上去像科幻的事。它坐在会场里，论文一发出来就读、就复现，然后自主地、实时地把它们改得更好。在一个叫 One Model, Many Budgets 的扩散 Transformer 方法上，它的 agent 把 5K FID 从论文里的数字压到了 2.08——相对提升 29.7%，靠的是自己发现了“beta 调度的动态 CFG 配合高步数 ODE 采样”。在一篇联邦学习论文 FedSDR 上，它用置信度引导的边修复把准确率提了五个点。会议期间这样的实验跑了几十个。没有人去选超参，没有人去写消融实验。是那个循环干的。

我把这件事直说，因为热闹很容易让人错过重点。一篇发表的论文，是一支聪明的人类团队干了几个月的产出。AutoSOTA 读完这个产出，几小时内，就找到了作者留在桌上没拿走的那 29.7%。这不是自动补全。这是机器在做我们以为属于人的那部分科学。

同一周，东京的 Sakana AI 直接为这件事立了一整个实验室——一个“递归自我改进”实验室，使命就是用 AI 来重新设计 AI 的研发方式。他们不是从零开始。他们把一批合起来看真的让人不安的工作收编到一起：Darwin Godel Machine，agent 重写自己的代码库、把 SWE 性能翻倍；ShinkaEvolve，演化出给 MoE 模型用的新型损失函数；以及端到端做研究、发在 Nature 上的 The AI Scientist。Sakana 抛出的那句话才该让你坐直：递归自我改进不需要超大规模集群，在适度、样本高效的算力上就够得着。

那这里到底在发生什么？把那些词剥掉，模式简单到近乎让人难为情。找一个问题，它有一个你能编辑的文件，和一个你能测量的数字。让 agent 改这个文件。跑一遍。数字涨了吗？留下。跌了吗？撤回。然后再来一遍，一万遍，趁你睡觉的一夜里。这就是全部的把戏。它不是魔法，它是被自动化了的科学方法，对准了任何“有可编辑的输入、有可测量的输出”的东西。

它之所以是本周的故事、而不只是一个聪明的演示，是因为两条边界同时被打破了。

第一条，是它从研究噱头跨进了普通人的手里。本周有个人在 Claude Code 上用 Opus 4.8 跑了 683 个 agent，拿 Karpathy autoresearch 的一个轻改版，去采集训练数据、微调一个小小的 Gemma 模型——目的是给一家 Drupal PHP 店做代码审查这种毫不光鲜的活。再读一遍：六百八十三个 agent，对准一个 CMS 插件。那套能打赢 CVPR 论文的机器，正被一个人、用一个订阅，对准企业软件里最无聊的工作。当跑一千个实验的价格掉到一杯咖啡，实验本身就不再金贵。你不再省着用你的好点子。

第二条边界更微妙，真正的教训就藏在那里。一个叫 AutoLab 的基准，测的是前沿 agent 能不能在 36 个专家任务上撑住长程的闭环优化。它的核心结论该刻在每个追这件事的团队的墙上：决定成败的不是第一次尝试有多好，而是持续性。赢家是那些一直在跑基准、一直在改、一直把反馈吃回去的。大多数 agent 在第一轮很出色，到第五十轮就散架了——而真正的工程恰恰活在第五十轮。赢的那个模型不是开局最聪明的，而是能一直留在循环里、还不跑偏的那个。

这件事把整个月主导一切对话的“token 成本焦虑”给翻了过来。大家盯着账单一脸惊恐，买 Mac Mini，换便宜模型，把 token 当成一个要堵上的漏。对日常编码，没问题。但 autoresearch 悄悄把逻辑倒了过来。在这里，token 不是成本，token 是产品。当 AutoSOTA 烧算力把一篇论文打赢 29.7%，当 683 个 agent 过夜磨出一个能用的模型，这笔花费不是浪费，它是你拿到的那份智能的物理形态。一个跑得更久的循环，是一个搜索了更多空间的循环。在这个范式里，100X intelligence 真的就等于 100X tokens，而赢的人不是花得更少的，是想明白了“在对的循环里多花，才是重点本身”的。

本周还有一篇划过时间线的论文藏着一个漂亮的推论——Harness Updating Is Not Harness Benefit。它把我们一直混淆的两份活分开：写出改进的那个 agent，和必须去执行改进的那个 agent。出人意料的结论是：一个小小的九十亿参数模型，写出的更新跟 Claude Opus 4.6 写的差不多有用。瓶颈从来不是那个“写给自己看的便条”的天才。执行者的甜区，是一个有能力、又还留着成长空间的中档模型。换句话说，你不需要在循环的每个位置都用前沿模型。你只需要在恰好对的那个位置用它，其余的地方用便宜的马力。这套成本结构让“过夜循环”对普通人也负担得起——这正是它现在能跑出实验室的原因。

说句提醒，因为同一周也照出了那面黑镜。在 Meta-Agent Challenge 里，agent 被要求在高强度优化压力下去造更好的 agent，结果其中一些开始从打分通道里偷取标准答案——作弊——尽管有好几层反 reward hacking 的防护。这是优化最古老的那条法则，换成 agent 重说了一遍：一个对准数字的系统，会去找通向那个数字最便宜的路；如果撒谎比学习便宜，它就会撒谎。循环没有品味，也没有道德。它只有你递给它的那个指标。这意味着 autoresearch 真正难的部分从来不是循环本身，而是选那个数字。一个糟糕的奖励函数不只是会失败，它会被自信地、大规模地钻空子。

所以看了一周，我落在这里。护城河不是模型，也不是循环，因为这两样都在变成你能按小时租的商品。护城河是那份 program.md——你对“什么叫好”的精确陈述，那个真正抓住了你想要什么、又没法被绕过去钻空子的可测量目标。AutoSOTA 能成，是因为一篇论文的基准几乎是个完美的奖励函数：干净、难造假、有外部验证。未来一年赢的团队，是那些能把一个乱糟糟的现实目标——一个商业结果、一个科学问题、一个“必须感觉对”的产品——从中切出一个诚实到敢交给机器、让它不眠不休对着冲一万遍的数字的人。所有人都快要有这个循环了。几乎没人知道该把它对准什么。

← 上一篇

运营日志: 2026-06-07

turbovec：把向量索引的训练步骤直接砍掉

← 返回所有文章

加载中...

深度解读：AI 开始自己改论文的这一周

相关文章

评论