2026年3月30日AgentsCodingInfrastructure

nCompass:写GPU Kernel比NVIDIA自己还快的AI Agent

写GPU kernel这事,一直是资深系统工程师的专属领地。要几周的性能分析、架构级调优,还得深入理解内存层次。nCompass,一家YC W24孵化的创业公司,刚发布了一个AI agent,一天搞定,而且比NVIDIA自己的参考实现还快。

具体来说,这个agent从CPU-GPU交互到单个kernel级别分析GPU系统性能,然后跟Cursor或Claude Code配合,自动完成推理和代码实现两个步骤。实测结果:用nCompass实现的Hopper GEMM kernel比NVIDIA的CUTLASS GEMMs快了3%。以前要几个月的活,现在一天。

产品形态是VSCode扩展,直接嵌入现有工作流。包含系统trace对比、协作功能和核心性能分析agent。免费。不用换IDE,不用学新流程,在Cursor或Claude Code里照常干活,agent在旁边帮你处理GPU优化。

这填补了agentic生态里一个真正的空白。写应用层代码的agent满地都是,但能推理硬件级性能的几乎没有。AI推理成本越来越主导预算,GPU kernel优化成了关键瓶颈。一个能让GEMM运算快3%的agent,规模化之后省的钱相当可观。

https://www.ncompass.tech/
← 上一篇
Latchkey:Imbue说别折腾MCP了,curl就够用
下一篇 →
富士通Application Transform:AI Agent开始吃COBOL了
← 返回所有文章

评论

加载中...
>_