最佳实践：少用 token

在 Rakenne 中减少 token 消耗、获得更快更省结果的实用建议。

2026-02-12
Tokens Efficiency Prompts

作者 Ricardo Cabral · Founder

您发送给智能体的每条消息和每个文件都会消耗 token。少用 token 意味着成本更低、响应更快。以下是在 Rakenne 中保持高效的一些实用做法。

1. 保持提示聚焦

一次只问一件事，不要在一则消息里堆很多问题。
尽量具体：文档较长时，「总结第二段」比「总结一下」更好。
避免在后续消息中重复大段上下文；智能体已有对话内容。

2. 精简工作区

移除或移走当前任务不需要的文件。智能体能看见项目中的全部内容。
在测试或探索时，使用小而具代表性的样本，而不是上传整个大型数据集。
在工作区中只保留您实际在用的文档。

3. 任务变化时重新开始

面对新目标或新文档集时，开启新会话。旧消息和引用会增加 token 并可能干扰智能体。
利用会话管理决定何时在同一对话中继续、何时重新开始。

4. 优先结构而非长度

若需要特定格式的输出，一开始就说明（例如「用要点回答」或「使用这个模板」）。
简短、结构化的回答通常比冗长、自由式的回答消耗更少 token。

5. 与上下文整洁结合

上下文整洁与少用 token 相辅相成：工作区和对话中无关内容越少，模型需要读取和处理的内容就越少。可参阅 LLM 上下文整洁与会话管理教程，形成完整做法。

准备好让你的专业知识驱动工作流了吗？

告别死板的模板和复杂的工具。用 Markdown 写下你的流程，智能体完成剩下的一切。今天就开始用 Rakenne 构建 AI 文档工作流。

免费开始 — 无需注册