Bonnes pratiques : Utiliser moins de tokens
Conseils pratiques pour réduire l'usage de tokens et obtenir des réponses plus rapides et moins coûteuses dans Rakenne.
Chaque message et chaque fichier envoyé à l’agent consomme des tokens. Utiliser moins de tokens signifie un coût plus bas et des réponses plus rapides. Voici des moyens pratiques de rester efficace dans Rakenne.
1. Garder les prompts focalisés
- Posez une question à la fois au lieu d’empiler plusieurs dans un seul message.
- Soyez précis : « Résume le deuxième paragraphe » vaut mieux que « résume ça » quand le document est long.
- Évitez de répéter un long contexte dans les messages suivants ; l’agent a déjà la conversation.
2. Nettoyer l’espace de travail
- Supprimez ou déplacez les fichiers inutiles à la tâche en cours. L’agent voit tout ce qui est dans le projet.
- Utilisez de petits échantillons représentatifs au lieu de téléverser des jeux de données entiers quand vous testez ou explorez.
- Gardez uniquement les documents sur lesquels vous travaillez vraiment dans l’espace actif.
3. Repartir à zéro quand la tâche change
- Pour un nouvel objectif ou un nouvel ensemble de documents, démarrez une nouvelle session. Les anciens messages et références ajoutent des tokens et peuvent brouiller l’agent.
- Utilisez la gestion des sessions pour décider quand continuer dans le même fil et quand recommencer.
4. Préférer la structure à la longueur
- Quand vous voulez une sortie dans un format donné, dites-le dès le départ (ex. « Réponds en puces » ou « Utilise ce modèle »).
- Des réponses courtes et structurées consomment souvent moins de tokens que des réponses longues et libres.
5. Combiner avec l’hygiène du contexte
Contexte propre et moins de tokens vont de pair : moins de contenu hors-sujet dans le workspace et dans la conversation signifie que le modèle a moins à lire et traiter. Voir Hygiène du contexte LLM et le tutoriel Gestion des sessions pour tout mettre ensemble.