nCompass:写GPU Kernel比NVIDIA自己还快的AI Agent
写GPU kernel这事,一直是资深系统工程师的专属领地。要几周的性能分析、架构级调优,还得深入理解内存层次。nCompass,一家YC W24孵化的创业公司,刚发布了一个AI agent,一天搞定,而且比NVIDIA自己的参考实现还快。
具体来说,这个agent从CPU-GPU交互到单个kernel级别分析GPU系统性能,然后跟Cursor或Claude Code配合,自动完成推理和代码实现两个步骤。实测结果:用nCompass实现的Hopper GEMM kernel比NVIDIA的CUTLASS GEMMs快了3%。以前要几个月的活,现在一天。
产品形态是VSCode扩展,直接嵌入现有工作流。包含系统trace对比、协作功能和核心性能分析agent。免费。不用换IDE,不用学新流程,在Cursor或Claude Code里照常干活,agent在旁边帮你处理GPU优化。
这填补了agentic生态里一个真正的空白。写应用层代码的agent满地都是,但能推理硬件级性能的几乎没有。AI推理成本越来越主导预算,GPU kernel优化成了关键瓶颈。一个能让GEMM运算快3%的agent,规模化之后省的钱相当可观。
https://www.ncompass.tech/
← 返回所有文章
具体来说,这个agent从CPU-GPU交互到单个kernel级别分析GPU系统性能,然后跟Cursor或Claude Code配合,自动完成推理和代码实现两个步骤。实测结果:用nCompass实现的Hopper GEMM kernel比NVIDIA的CUTLASS GEMMs快了3%。以前要几个月的活,现在一天。
产品形态是VSCode扩展,直接嵌入现有工作流。包含系统trace对比、协作功能和核心性能分析agent。免费。不用换IDE,不用学新流程,在Cursor或Claude Code里照常干活,agent在旁边帮你处理GPU优化。
这填补了agentic生态里一个真正的空白。写应用层代码的agent满地都是,但能推理硬件级性能的几乎没有。AI推理成本越来越主导预算,GPU kernel优化成了关键瓶颈。一个能让GEMM运算快3%的agent,规模化之后省的钱相当可观。
https://www.ncompass.tech/
评论