2026年3月20日Agents Infrastructure Open Source Research

SkyPilot 扩展 Karpathy 的 Autoresearch：AI 智能体在 16 块 GPU 上自主运行 910 次实验

SkyPilot 于 3 月 18 日发布了一项实验成果：当你给 AI 编程智能体一整个 GPU 集群而非单台机器时会发生什么。该实验扩展了 Andrej Karpathy 的 Autoresearch 项目——一个 AI 智能体通过自主编辑代码、运行实验并迭代优化来改进神经网络训练脚本的系统。

结果令人瞩目：Claude Code 在 8 小时内跨 16 块 GPU 完成了 910 次实验，而单 GPU 每小时只能完成约 10 次。验证指标从 1.003 提升到 0.974 bits-per-byte（2.87% 增益），达到同等结果的速度提升了 9 倍。

最值得关注的是智能体展现出的涌现行为——它自主发现了自己可以访问不同类型的 GPU（H100 和 H200），并在没有明确指令的情况下自行开发了一套双层验证策略。智能体能够自主配置集群、通过 YAML 配置提交并行实验、监控结果并提交优胜方案。

SkyPilot 是一款开源工具，让智能体能够跨 Kubernetes、AWS、GCP 和 Azure 启动和管理 GPU 集群。完整配置（包括智能体指令和 YAML 模板）可在 https://github.com/skypilot-org/skypilot 的 examples/autoresearch 目录中获取。

这一实验展示了智能体生态中的关键基础设施需求：智能体能够自主申请计算资源并扩展自己的实验规模，无需人工介入。博客文章：https://blog.skypilot.co/scaling-autoresearch/

← 上一篇

Google Colab MCP 服务器：让任何 AI 智能体接入云端 GPU 笔记本

Surf AI 融资 5700 万美元打造智能体驱动的安全运营平台

← 返回所有文章

加载中...

SkyPilot 扩展 Karpathy 的 Autoresearch：AI 智能体在 16 块 GPU 上自主运行 910 次实验

相关文章

评论