2026年3月30日Agents Coding Infrastructure

nCompass：写GPU Kernel比NVIDIA自己还快的AI Agent

写GPU kernel这事，一直是资深系统工程师的专属领地。要几周的性能分析、架构级调优，还得深入理解内存层次。nCompass，一家YC W24孵化的创业公司，刚发布了一个AI agent，一天搞定，而且比NVIDIA自己的参考实现还快。

具体来说，这个agent从CPU-GPU交互到单个kernel级别分析GPU系统性能，然后跟Cursor或Claude Code配合，自动完成推理和代码实现两个步骤。实测结果：用nCompass实现的Hopper GEMM kernel比NVIDIA的CUTLASS GEMMs快了3%。以前要几个月的活，现在一天。

产品形态是VSCode扩展，直接嵌入现有工作流。包含系统trace对比、协作功能和核心性能分析agent。免费。不用换IDE，不用学新流程，在Cursor或Claude Code里照常干活，agent在旁边帮你处理GPU优化。

这填补了agentic生态里一个真正的空白。写应用层代码的agent满地都是，但能推理硬件级性能的几乎没有。AI推理成本越来越主导预算，GPU kernel优化成了关键瓶颈。一个能让GEMM运算快3%的agent，规模化之后省的钱相当可观。

https://www.ncompass.tech/

← 上一篇

Latchkey：Imbue说别折腾MCP了，curl就够用

富士通Application Transform：AI Agent开始吃COBOL了

← 返回所有文章

加载中...

nCompass：写GPU Kernel比NVIDIA自己还快的AI Agent

相关文章

评论