最佳实践:少用 token
在 Rakenne 中减少 token 消耗、获得更快更省结果的实用建议。
您发送给智能体的每条消息和每个文件都会消耗 token。少用 token 意味着成本更低、响应更快。以下是在 Rakenne 中保持高效的一些实用做法。
1. 保持提示聚焦
- 一次只问一件事,不要在一则消息里堆很多问题。
- 尽量具体:文档较长时,「总结第二段」比「总结一下」更好。
- 避免在后续消息中重复大段上下文;智能体已有对话内容。
2. 精简工作区
- 移除或移走当前任务不需要的文件。智能体能看见项目中的全部内容。
- 在测试或探索时,使用小而具代表性的样本,而不是上传整个大型数据集。
- 在工作区中只保留您实际在用的文档。
3. 任务变化时重新开始
- 面对新目标或新文档集时,开启新会话。旧消息和引用会增加 token 并可能干扰智能体。
- 利用会话管理决定何时在同一对话中继续、何时重新开始。
4. 优先结构而非长度
- 若需要特定格式的输出,一开始就说明(例如「用要点回答」或「使用这个模板」)。
- 简短、结构化的回答通常比冗长、自由式的回答消耗更少 token。
5. 与上下文整洁结合
上下文整洁与少用 token 相辅相成:工作区和对话中无关内容越少,模型需要读取和处理的内容就越少。可参阅 LLM 上下文整洁 与 会话管理 教程,形成完整做法。