返回列表

最佳实践:少用 token

在 Rakenne 中减少 token 消耗、获得更快更省结果的实用建议。

  • 2026-02-12
作者 Ricardo Cabral · Founder

您发送给智能体的每条消息和每个文件都会消耗 token。少用 token 意味着成本更低、响应更快。以下是在 Rakenne 中保持高效的一些实用做法。

1. 保持提示聚焦

  • 一次只问一件事,不要在一则消息里堆很多问题。
  • 尽量具体:文档较长时,「总结第二段」比「总结一下」更好。
  • 避免在后续消息中重复大段上下文;智能体已有对话内容。

2. 精简工作区

  • 移除或移走当前任务不需要的文件。智能体能看见项目中的全部内容。
  • 在测试或探索时,使用小而具代表性的样本,而不是上传整个大型数据集。
  • 在工作区中只保留您实际在用的文档。

3. 任务变化时重新开始

  • 面对新目标或新文档集时,开启新会话。旧消息和引用会增加 token 并可能干扰智能体。
  • 利用会话管理决定何时在同一对话中继续、何时重新开始。

4. 优先结构而非长度

  • 若需要特定格式的输出,一开始就说明(例如「用要点回答」或「使用这个模板」)。
  • 简短、结构化的回答通常比冗长、自由式的回答消耗更少 token。

5. 与上下文整洁结合

上下文整洁与少用 token 相辅相成:工作区和对话中无关内容越少,模型需要读取和处理的内容就越少。可参阅 LLM 上下文整洁会话管理 教程,形成完整做法。

准备好让你的专业知识驱动工作流了吗?

告别死板的模板和复杂的工具。用 Markdown 写下你的流程,智能体完成剩下的一切。今天就开始用 Rakenne 构建 AI 文档工作流。

免费开始