Best practice: Usare meno token
Suggerimenti pratici per ridurre l'uso di token e ottenere risultati più veloci ed economici in Rakenne.
Ogni messaggio e ogni file che invii all’agente consuma token. Usare meno token significa costi più bassi e risposte più veloci. Ecco modi pratici per restare efficienti in Rakenne.
1. Mantenere i prompt focalizzati
- Chiedi una cosa alla volta invece di accumulare molte domande in un solo messaggio.
- Sii specifico: “Riassumi il secondo paragrafo” è meglio di “riassumi questo” quando il documento è lungo.
- Evita di ripetere contesto lungo nei messaggi successivi; l’agente ha già la conversazione.
2. Sfoltire il workspace
- Rimuovi o sposta i file non necessari per il compito corrente. L’agente vede tutto ciò che c’è nel progetto.
- Usa piccoli campioni rappresentativi invece di caricare interi dataset grandi quando testi o esplori.
- Tieni nel workspace attivo solo i documenti su cui stai effettivamente lavorando.
3. Ricominciare quando cambia il compito
- Per un nuovo obiettivo o un nuovo set di documenti, avvia una nuova sessione. I vecchi messaggi e riferimenti aggiungono token e possono confondere l’agente.
- Usa la gestione delle sessioni per decidere quando continuare nello stesso thread e quando ricominciare.
4. Preferire la struttura alla lunghezza
- Quando ti serve un output in un certo formato, dillo subito (es. “Rispondi in elenco puntato” o “Usa questo template”).
- Risposte più brevi e strutturate spesso usano meno token di risposte lunghe e libere.
5. Combinare con l’igiene del contesto
Contesto pulito e meno token vanno insieme: meno contenuto irrilevante nel workspace e nella conversazione significa che il modello ha meno da leggere e processare. Vedi Igiene del contesto LLM e il tutorial Gestione sessioni per mettere tutto insieme.