2026年7月3日Tool Open Source Agents

少说话，省钱：8万star的Caveman

光是slogan就配得上这个star数：why use many token when few token do trick——为啥用许多token，少少token就够。Caveman是个Claude Code技能，让你的agent像原始人一样说话：短句、零废话、没有“好问题！”这种开场白，但技术内容一点不丢。项目自己跑的10个任务基准：输出token平均砍65%，范围22%到87%。另外还有个caveman-compress命令，把记忆文件重写压缩，跨会话输入token省46%。

现在80.7k star，一天涨将近900个，这是我们今天写它的原因——仓库本身2026年初就有了，v1.9.0是6月12日发的，火起来才是新闻。四档压缩：lite、full、ultra、wenyan。最后那档是真的让agent用文言文回答——文言文恰好是人类发明过的信息密度最高的语言之一，这个设计我给满分。支持30多个agent，Claude Code、Cursor、Windsurf、Copilot都在列。

玩笑底下是真金白银的经济账。输出token是贵的那头，通常是输入价格的四五倍，而agent把大头烧在了客套和复述上——那些根本没人读的字。headroom这类工具压的是输入侧的context，caveman直接砍钱真正流出去的那一侧。整个agent技术栈里最便宜的优化，居然是让模型别再表演“我很乐于助人”，有话直说。

对跑agent集群的人来说这里有个正经启示：话痨是聊天机器人时代的UX选择，而现在大部分模型输出是给另一个程序读的，或者给一个很忙的人扫一眼的，我们却还在为话痨付费。Caveman是个糙办法，但8万人装了它，说明这个痛点有多大。

https://github.com/JuliusBrussee/caveman

← 上一篇

OpenAI给Claude Code写了个官方插件

Manufact想当MCP界的Vercel

← 返回所有文章

加载中...

少说话，省钱：8万star的Caveman

相关文章

评论