少说话,省钱:8万star的Caveman
光是slogan就配得上这个star数:why use many token when few token do trick——为啥用许多token,少少token就够。Caveman是个Claude Code技能,让你的agent像原始人一样说话:短句、零废话、没有“好问题!”这种开场白,但技术内容一点不丢。项目自己跑的10个任务基准:输出token平均砍65%,范围22%到87%。另外还有个caveman-compress命令,把记忆文件重写压缩,跨会话输入token省46%。
现在80.7k star,一天涨将近900个,这是我们今天写它的原因——仓库本身2026年初就有了,v1.9.0是6月12日发的,火起来才是新闻。四档压缩:lite、full、ultra、wenyan。最后那档是真的让agent用文言文回答——文言文恰好是人类发明过的信息密度最高的语言之一,这个设计我给满分。支持30多个agent,Claude Code、Cursor、Windsurf、Copilot都在列。
玩笑底下是真金白银的经济账。输出token是贵的那头,通常是输入价格的四五倍,而agent把大头烧在了客套和复述上——那些根本没人读的字。headroom这类工具压的是输入侧的context,caveman直接砍钱真正流出去的那一侧。整个agent技术栈里最便宜的优化,居然是让模型别再表演“我很乐于助人”,有话直说。
对跑agent集群的人来说这里有个正经启示:话痨是聊天机器人时代的UX选择,而现在大部分模型输出是给另一个程序读的,或者给一个很忙的人扫一眼的,我们却还在为话痨付费。Caveman是个糙办法,但8万人装了它,说明这个痛点有多大。
https://github.com/JuliusBrussee/caveman
← 返回所有文章
现在80.7k star,一天涨将近900个,这是我们今天写它的原因——仓库本身2026年初就有了,v1.9.0是6月12日发的,火起来才是新闻。四档压缩:lite、full、ultra、wenyan。最后那档是真的让agent用文言文回答——文言文恰好是人类发明过的信息密度最高的语言之一,这个设计我给满分。支持30多个agent,Claude Code、Cursor、Windsurf、Copilot都在列。
玩笑底下是真金白银的经济账。输出token是贵的那头,通常是输入价格的四五倍,而agent把大头烧在了客套和复述上——那些根本没人读的字。headroom这类工具压的是输入侧的context,caveman直接砍钱真正流出去的那一侧。整个agent技术栈里最便宜的优化,居然是让模型别再表演“我很乐于助人”,有话直说。
对跑agent集群的人来说这里有个正经启示:话痨是聊天机器人时代的UX选择,而现在大部分模型输出是给另一个程序读的,或者给一个很忙的人扫一眼的,我们却还在为话痨付费。Caveman是个糙办法,但8万人装了它,说明这个痛点有多大。
https://github.com/JuliusBrussee/caveman
评论