# 最佳实践：少用 token

> 在 Rakenne 中减少 token 消耗、获得更快更省结果的实用建议。

Author: map[bio:Founder linkedin:https://www.linkedin.com/in/ricardocabral/ name:Ricardo Cabral]
Published: 2026-02-12
Tags: tokens, efficiency, prompts
URL: https://rakenne.app/zh-cn/learn/best-practices/using-fewer-tokens/index.md


您发送给智能体的每条消息和每个文件都会消耗 token。少用 token 意味着成本更低、响应更快。以下是在 Rakenne 中保持高效的一些实用做法。

## 1. 保持提示聚焦

- 一次只问一件事，不要在一则消息里堆很多问题。
- 尽量具体：文档较长时，「总结第二段」比「总结一下」更好。
- 避免在后续消息中重复大段上下文；智能体已有对话内容。

## 2. 精简工作区

- 移除或移走当前任务不需要的文件。智能体能看见项目中的全部内容。
- 在测试或探索时，使用小而具代表性的样本，而不是上传整个大型数据集。
- 在工作区中只保留您实际在用的文档。

## 3. 任务变化时重新开始

- 面对新目标或新文档集时，开启新会话。旧消息和引用会增加 token 并可能干扰智能体。
- 利用会话管理决定何时在同一对话中继续、何时重新开始。

## 4. 优先结构而非长度

- 若需要特定格式的输出，一开始就说明（例如「用要点回答」或「使用这个模板」）。
- 简短、结构化的回答通常比冗长、自由式的回答消耗更少 token。

## 5. 与上下文整洁结合

上下文整洁与少用 token 相辅相成：工作区和对话中无关内容越少，模型需要读取和处理的内容就越少。可参阅 [LLM 上下文整洁](/learn/best-practices/llm-context-hygiene/) 与 [会话管理](/learn/tutorials/session-management/) 教程，形成完整做法。


---

Back to [最佳实践](https://rakenne.app/zh-cn/learn/best-practices/index.md)