在提示工程与表演艺术之间,一位开发者在Reddit上发布了一项发现,让AI社区在关注之前先发笑:教Claude像史前人类一样交流,观看你的令牌费用下降高达75%。
这篇帖子上周在r/ClaudeAI上发布,自那时以来已经收到了超过400条评论和10K票,这是互联网通常会奖励的真正技术洞察与荒诞喜剧的罕见组合。
这个机制很简单。开发者没有让Claude以寒暄开始,而是叙述它每一步的过程,并以提供进一步帮助的邀请结束,而是将模型限制为简短、精简的句子。工具优先,结果优先,不解释。一个正常的网页搜索任务通常会生成约180个输出令牌,但它缩减到了约45个。原作者声称输出减少高达75%,通过让模型听起来像刚发现火一样。
用穴居人的话来说,正如一位Reddit用户所说:“为什么浪费时间说很多话,而少数话就能解决问题?”
这个技术没有触及的是输入上下文:完整的对话历史、附加文件和模型在每次交互中重新读取的系统指令。这个输入通常大于输出,尤其是在较长的编码会话中。考虑到所有这些输入的现实世界会话,节省约为25%,而不是75%。仍然是有意义的,只是不是头条数字。
向模型提供正常指令也是个好主意。不要给它“穴居人”的说话风格,因为这可能会导致“垃圾进,垃圾出”的情况。
还有一个智力退化的问题。在讨论中,一些研究者争辩说,强迫AI扮演一个较不复杂的角色可能会损害其推理质量——语言限制可能会渗透到认知限制中。这个担忧还没有得到明确的解决,但在评估结果时值得考虑。
技能好,技能病毒爆发
尽管有警告,这项技术几乎立即在GitHub上获得了第二次生命。
开发者Shawnchee将规则打包成一个独立的穴居人技能,与Claude Code、Cursor、Windsurf、Copilot以及40多个其他代理兼容。该技能将方法提炼为10条规则:没有填充短语,先执行再解释,没有元评论,没有开场白,没有结尾,没有工具公告,只有在需要时才解释,让代码自己发声,把错误当作修复的事情而不是叙述。
在这个回购中,通过tiktoken验证的基准显示,网页搜索任务的输出令牌减少了68%,代码编辑任务减少了50%,问答交流减少了72%——四个标准任务的平均输出减少为61%。
开发者Julius Brussee的平行回购采取了稍微不同的方法,将相同的想法框架为一个SKILL.md文件,在GitHub上获得了562颗星。规格:像聪明的穴居人那样回应,删减文章、填充和寒暄,保留所有技术内容。代码块保持不变。错误消息准确引用。技术术语保持完整。穴居人只说事实周围的英语包装。
这个版本甚至带有不同的模式,以影响你想要剥离的程度,可以在正常、精简和超精简之间切换。这些模型做着完全相同的工作,但提供了更短的答案,这在时间上大大节省了开销。
更广泛的成本背景给这个笑话增添了更锐利的边缘。Anthropic是按令牌价格计算的最贵模型之一。对于那些在每个会话中进行数十次轮换的开发者来说,输出冗长并不是一种风格上的抱怨,而是一个需要考虑的项目。如果一个穴居人的哼声可以替代模型刚刚做的五句话摘要,那么那些节省的令牌将在成千上万的API调用中累积。
穴居人技能可以通过skills.sh通过一条命令安装,并在全球项目中工作。无论它是否让Claude的表达稍微变得不那么清晰,它已经让很多开发者显著减少了烦恼。
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。