SkyPilot 扩展 Karpathy 的 Autoresearch:AI 智能体在 16 块 GPU 上自主运行 910 次实验
SkyPilot 于 3 月 18 日发布了一项实验成果:当你给 AI 编程智能体一整个 GPU 集群而非单台机器时会发生什么。该实验扩展了 Andrej Karpathy 的 Autoresearch 项目——一个 AI 智能体通过自主编辑代码、运行实验并迭代优化来改进神经网络训练脚本的系统。
结果令人瞩目:Claude Code 在 8 小时内跨 16 块 GPU 完成了 910 次实验,而单 GPU 每小时只能完成约 10 次。验证指标从 1.003 提升到 0.974 bits-per-byte(2.87% 增益),达到同等结果的速度提升了 9 倍。
最值得关注的是智能体展现出的涌现行为——它自主发现了自己可以访问不同类型的 GPU(H100 和 H200),并在没有明确指令的情况下自行开发了一套双层验证策略。智能体能够自主配置集群、通过 YAML 配置提交并行实验、监控结果并提交优胜方案。
SkyPilot 是一款开源工具,让智能体能够跨 Kubernetes、AWS、GCP 和 Azure 启动和管理 GPU 集群。完整配置(包括智能体指令和 YAML 模板)可在 https://github.com/skypilot-org/skypilot 的 examples/autoresearch 目录中获取。
这一实验展示了智能体生态中的关键基础设施需求:智能体能够自主申请计算资源并扩展自己的实验规模,无需人工介入。博客文章:https://blog.skypilot.co/scaling-autoresearch/
← 返回所有文章
结果令人瞩目:Claude Code 在 8 小时内跨 16 块 GPU 完成了 910 次实验,而单 GPU 每小时只能完成约 10 次。验证指标从 1.003 提升到 0.974 bits-per-byte(2.87% 增益),达到同等结果的速度提升了 9 倍。
最值得关注的是智能体展现出的涌现行为——它自主发现了自己可以访问不同类型的 GPU(H100 和 H200),并在没有明确指令的情况下自行开发了一套双层验证策略。智能体能够自主配置集群、通过 YAML 配置提交并行实验、监控结果并提交优胜方案。
SkyPilot 是一款开源工具,让智能体能够跨 Kubernetes、AWS、GCP 和 Azure 启动和管理 GPU 集群。完整配置(包括智能体指令和 YAML 模板)可在 https://github.com/skypilot-org/skypilot 的 examples/autoresearch 目录中获取。
这一实验展示了智能体生态中的关键基础设施需求:智能体能够自主申请计算资源并扩展自己的实验规模,无需人工介入。博客文章:https://blog.skypilot.co/scaling-autoresearch/