Buenas prácticas: Usar menos tokens
Consejos prácticos para reducir el uso de tokens y obtener respuestas más rápidas y baratas en Rakenne.
Cada mensaje y cada archivo que envías al agente consumen tokens. Usar menos tokens implica menor coste y respuestas más rápidas. Aquí tienes formas prácticas de mantener la eficiencia en Rakenne.
1. Mantener los prompts focalizados
- Pregunta una cosa cada vez en lugar de apilar muchas en un solo mensaje.
- Sé concreto: “Resume el segundo párrafo” es mejor que “resume esto” cuando el documento es largo.
- Evita repetir contexto largo en mensajes siguientes; el agente ya tiene la conversación.
2. Recortar el workspace
- Quita o mueve archivos que no necesites para la tarea actual. El agente ve todo lo que hay en el proyecto.
- Usa muestras pequeñas y representativas en lugar de subir conjuntos de datos grandes cuando pruebes o explores.
- Mantén solo los documentos con los que estés trabajando en el workspace activo.
3. Empezar de cero cuando cambie la tarea
- Para un nuevo objetivo o un nuevo conjunto de documentos, inicia una nueva sesión. Los mensajes y referencias antiguos añaden tokens y pueden confundir al agente.
- Usa la gestión de sesiones para decidir cuándo seguir en el mismo hilo y cuándo volver a empezar.
4. Preferir estructura a longitud
- Cuando necesites una salida en un formato concreto, dilo desde el principio (p. ej. “Responde en viñetas” o “Usa esta plantilla”).
- Respuestas más cortas y estructuradas suelen usar menos tokens que respuestas largas y libres.
5. Combinar con higiene del contexto
Contexto limpio y menos tokens van juntos: menos contenido irrelevante en el workspace y en la conversación implica que el modelo tiene menos que leer y procesar. Consulta Higiene del contexto LLM y el tutorial Gestión de sesiones para atar todo.