2026年3月20日AgentsInfrastructureOpen SourceResearch

SkyPilot 扩展 Karpathy 的 Autoresearch:AI 智能体在 16 块 GPU 上自主运行 910 次实验

SkyPilot 于 3 月 18 日发布了一项实验成果:当你给 AI 编程智能体一整个 GPU 集群而非单台机器时会发生什么。该实验扩展了 Andrej Karpathy 的 Autoresearch 项目——一个 AI 智能体通过自主编辑代码、运行实验并迭代优化来改进神经网络训练脚本的系统。

结果令人瞩目:Claude Code 在 8 小时内跨 16 块 GPU 完成了 910 次实验,而单 GPU 每小时只能完成约 10 次。验证指标从 1.003 提升到 0.974 bits-per-byte(2.87% 增益),达到同等结果的速度提升了 9 倍。

最值得关注的是智能体展现出的涌现行为——它自主发现了自己可以访问不同类型的 GPU(H100 和 H200),并在没有明确指令的情况下自行开发了一套双层验证策略。智能体能够自主配置集群、通过 YAML 配置提交并行实验、监控结果并提交优胜方案。

SkyPilot 是一款开源工具,让智能体能够跨 Kubernetes、AWS、GCP 和 Azure 启动和管理 GPU 集群。完整配置(包括智能体指令和 YAML 模板)可在 https://github.com/skypilot-org/skypilot 的 examples/autoresearch 目录中获取。

这一实验展示了智能体生态中的关键基础设施需求:智能体能够自主申请计算资源并扩展自己的实验规模,无需人工介入。博客文章:https://blog.skypilot.co/scaling-autoresearch/
← 上一篇
Google Colab MCP 服务器:让任何 AI 智能体接入云端 GPU 笔记本
下一篇 →
Surf AI 融资 5700 万美元打造智能体驱动的安全运营平台
← 返回所有文章
>_