Rakenne 0.5.0 — Moteur de templates, extraction de variables et outils DOCX
0.5.0 introduit un moteur de templates piloté par schéma pour le rendu de documents structurés, un pipeline d'extraction riche en traçabilité pour extraire les variables des documents sources, et une suite complète d'outils pour créer et éditer des fichiers Word.
Nous avons le plaisir d’annoncer Rakenne 0.5.0. Cette version apporte trois nouvelles capacités majeures : un moteur de templates pour le rendu de documents structurés à partir de variables validées, un pipeline d’extraction pour extraire les données variables des documents sources avec une traçabilité complète, et une skill outils DOCX pour créer, éditer et convertir des fichiers Word.
Moteur de templates
Les skills peuvent désormais définir un schéma de variables et des templates de documents pour leurs sorties. L’agent utilise quatre nouveaux outils pour valider, analyser, rendre et auditer le résultat :
- Validate variables — Vérifie les valeurs des variables par rapport au schéma. Prend en charge les types riches (devises, dates, CNPJ, CPF, pourcentages, tableaux markdown) et indique le taux de remplissage pour savoir à quel point les données sont complètes avant le rendu.
- Lint template — Détecte les erreurs avant le rendu : helpers manquants, variables non définies, valeurs optionnelles sans texte de repli. Signale les problèmes avec les références de fichier et de ligne pour que l’agent puisse les corriger directement.
- Render template — Substitue les variables validées dans le template avec un formatage adapté à la locale (p. ex.
R$ 1.500.000,00pour le portugais brésilien,$1,500,000.00pour l’anglais). Les variables dérivées sont calculées automatiquement à partir de leurs sources. - Audit render — Compare la sortie rendue avec le template original. Vérifie que les zones immuables (mentions réglementaires, clauses types) sont inchangées, effectue des contrôles anti-contamination et applique des budgets de modification pour que l’agent reste dans les limites attendues.
Les templates prennent en charge les partiels, les sections conditionnelles et plus de 40 helpers de formatage adaptés à la locale. Le moteur est déterministe — les mêmes entrées produisent toujours la même sortie.
Extraction de variables
Un nouveau pipeline de huit outils permet à l’agent d’extraire des variables structurées à partir de documents sources (PDF, DOCX ou autres formats) et de produire un fichier variables.json prêt pour le moteur de templates :
- Ingest — Convertit le document source en un corpus de pages adressable par ligne (un fichier markdown par page) afin que chaque valeur extraite puisse être retracée jusqu’à son emplacement exact.
- Segment — Détecte les limites de sections à l’aide d’une définition taxonomique, découpant le corpus en morceaux gérables que l’agent lit un par un.
- Record — À mesure que l’agent lit chaque section, il enregistre les valeurs extraites. L’outil les normalise automatiquement — devises, dates et identifiants sont convertis dans leur format de stockage standard — et associe à chaque valeur sa page et son intervalle de lignes.
- Consolidate — Fusionne toutes les extractions de sections en un seul
variables.json. Lorsqu’une même variable apparaît dans plusieurs sections, la résolution de conflits sélectionne le meilleur candidat en fonction de la validité, de la spécificité et de la priorité de section. - Double-check — Parcourt le corpus à la recherche de variables encore nulles après la consolidation, en utilisant des patterns sensibles au format pour faire remonter les candidats que l’agent aurait pu manquer.
Chaque valeur dans la sortie finale porte une provenance complète : quelle page, quelles lignes, quelle section, et comment les conflits ont été résolus. Le résultat s’intègre directement dans l’outil validate_variables du moteur de templates pour un flux extraction-puis-rendu fluide.
Outils DOCX
Une nouvelle skill docx-tools fournit à l’agent neuf outils pour travailler avec les documents Word :
- Build — Créez des fichiers
.docxde manière programmatique avec un contrôle complet sur les paragraphes, tableaux, en-têtes, pieds de page, listes et styles. - Unpack / Pack — Extrayez un
.docxen fichiers XML éditables (avec mise en forme automatique) et re-compressez-les en un.docxvalide. Utile pour des modifications de formatage précises qui vont au-delà de ce que l’outil de construction haut niveau propose. - Extract text — Extrayez le contenu du document en Markdown, avec un contrôle sur les modifications suivies : afficher toutes les marques, accepter la version finale ou rejeter pour revenir à l’original.
- Accept changes — Accepte toutes les modifications suivies, produisant un document propre sans marques de révision.
- Add comment — Ancrez des commentaires de révision sur un texte spécifique, avec prise en charge des réponses en fil de discussion.
- Validate — Vérifiez la structure du document pour détecter les fichiers manquants, le contenu malformé, les identifiants en double et les relations brisées, avec réparation automatique optionnelle.
- Convert — Convertissez entre
.doc,.docx, PDF, HTML et ODT.
La skill s’installe depuis la bibliothèque comme n’importe quelle autre et inclut des guides de référence pour que l’agent puisse construire des documents complexes sans aide externe.
Merci d’utiliser Rakenne. Ces trois fonctionnalités s’articulent en un pipeline — extraire les variables d’un document source, les injecter dans un template, et exporter le résultat sous forme de fichier Word soigné. Nous serions ravis de savoir comment vous les utilisez.
— L’équipe Rakenne