nCompass:NVIDIAの自社コードを超えるGPUカーネルAIエージェント
GPUカーネルの最適化は、シニアシステムエンジニアだけの領域だった。プロファイリングに数週間、アーキテクチャ固有のチューニング、メモリ階層の深い理解が必要とされる。YC W24出身のnCompassが出したAIエージェントは、それを1日でこなし、しかもNVIDIAのリファレンス実装を上回る。
具体的には、CPU-GPU間のやり取りから個別カーネルレベルまでGPUシステムのパフォーマンスを分析し、CursorやClaude Codeと連携して推論とコード実装の両方を自動化する。実績として、Hopper GEMMカーネルでNVIDIAのCUTLASS GEMMsを3%上回った。数ヶ月かかっていた作業が1日に。
VSCode拡張として提供され、既存のワークフローにそのまま組み込める。システムトレースの差分比較、コラボレーション機能、コアとなるパフォーマンス分析エージェントを搭載。無料で利用可能。IDEを切り替える必要もなく、CursorやClaude Codeの中でそのまま作業しながらGPU最適化を進められる。
これはエージェントエコシステムの実質的な空白を埋めるものだ。アプリケーション層のコードを書くエージェントは溢れているが、ハードウェアレベルのパフォーマンスを推論できるものはほぼ皆無。AI推論コストが予算の大半を占める時代に、GEMM演算を3%高速化できるエージェントは、スケール時に無視できないコスト削減をもたらす。
https://www.ncompass.tech/
← Back to all articles
具体的には、CPU-GPU間のやり取りから個別カーネルレベルまでGPUシステムのパフォーマンスを分析し、CursorやClaude Codeと連携して推論とコード実装の両方を自動化する。実績として、Hopper GEMMカーネルでNVIDIAのCUTLASS GEMMsを3%上回った。数ヶ月かかっていた作業が1日に。
VSCode拡張として提供され、既存のワークフローにそのまま組み込める。システムトレースの差分比較、コラボレーション機能、コアとなるパフォーマンス分析エージェントを搭載。無料で利用可能。IDEを切り替える必要もなく、CursorやClaude Codeの中でそのまま作業しながらGPU最適化を進められる。
これはエージェントエコシステムの実質的な空白を埋めるものだ。アプリケーション層のコードを書くエージェントは溢れているが、ハードウェアレベルのパフォーマンスを推論できるものはほぼ皆無。AI推論コストが予算の大半を占める時代に、GEMM演算を3%高速化できるエージェントは、スケール時に無視できないコスト削減をもたらす。
https://www.ncompass.tech/
Comments