Boas práticas: Usar menos tokens
Dicas práticas para reduzir o uso de tokens e obter respostas mais rápidas e baratas no Rakenne.
Cada mensagem e cada arquivo que você envia ao agente consome tokens. Usar menos tokens significa custo menor e respostas mais rápidas. Aqui estão formas práticas de manter a eficiência no Rakenne.
1. Manter os prompts focados
- Peça uma coisa de cada vez em vez de empilhar várias perguntas em uma única mensagem.
- Seja específico: “Resuma o segundo parágrafo” é melhor que “resuma isso” quando o documento é longo.
- Evite repetir contexto longo em mensagens seguintes; o agente já tem a conversa.
2. Enxugar o workspace
- Remova ou mova arquivos que não são necessários para a tarefa atual. O agente vê tudo o que está no projeto.
- Use amostras pequenas e representativas em vez de enviar conjuntos de dados grandes ao testar ou explorar.
- Mantenha no workspace ativo apenas os documentos com os quais você está de fato trabalhando.
3. Começar de novo quando a tarefa mudar
- Para um novo objetivo ou um novo conjunto de documentos, inicie uma nova sessão. Mensagens e referências antigas acrescentam tokens e podem confundir o agente.
- Use a gestão de sessões para decidir quando continuar no mesmo thread e quando recomeçar.
4. Preferir estrutura a extensão
- Quando precisar de saída em um formato certo, diga desde o início (ex.: “Responda em tópicos” ou “Use este template”).
- Respostas mais curtas e estruturadas costumam usar menos tokens que respostas longas e livres.
5. Combinar com higiene de contexto
Contexto limpo e menos tokens andam juntos: menos conteúdo irrelevante no workspace e na conversa significa que o modelo tem menos a ler e processar. Veja Higiene de contexto LLM e o tutorial Gestão de sessões para amarrar tudo.