Rakenne 0.5.0 — Motore di template, estrazione variabili e strumenti DOCX
0.5.0 introduce un motore di template basato su schema per la generazione di documenti strutturati, una pipeline di estrazione con tracciabilità completa per estrarre variabili dai documenti sorgente e una suite completa di strumenti per creare e modificare file Word.
Siamo lieti di annunciare Rakenne 0.5.0. Questa release aggiunge tre funzionalità principali: un motore di template per generare documenti strutturati a partire da variabili validate, una pipeline di estrazione per estrarre dati strutturati dai documenti sorgente con tracciabilità completa e una skill docx-tools per creare, modificare e convertire file Word.
Motore di template
Le skill possono ora definire uno schema delle variabili e dei template di documento per il loro output. L’agente utilizza quattro nuovi strumenti per validare, analizzare, generare e verificare il risultato:
- Validate variables — Controlla i valori delle variabili rispetto allo schema. Supporta tipi complessi (valute, date, CNPJ, CPF, percentuali, tabelle markdown) e riporta il tasso di completamento per sapere quanto sono completi i dati prima della generazione.
- Lint template — Individua errori prima della generazione: helper mancanti, variabili non definite, valori opzionali senza testo di fallback. Riporta i problemi con riferimenti a file e riga così l’agente può correggerli direttamente.
- Render template — Sostituisce le variabili validate nel template con formattazione sensibile alla lingua (es.
R$ 1.500.000,00per il portoghese brasiliano,$1,500,000.00per l’inglese). Le variabili derivate vengono calcolate automaticamente dalle loro sorgenti. - Audit render — Confronta l’output generato con il template originale. Verifica che le zone immutabili (clausole normative, testi standard) siano rimaste invariate, esegue controlli anti-contaminazione e applica limiti di modifica affinché l’agente resti entro i margini previsti.
I template supportano partial, sezioni condizionali e oltre 40 helper di formattazione sensibili alla lingua. Il motore è deterministico: gli stessi input producono sempre lo stesso output.
Estrazione variabili
Una nuova pipeline a otto strumenti permette all’agente di estrarre variabili strutturate dai documenti sorgente (PDF, DOCX o altri formati) e produrre un file variables.json pronto per il motore di template:
- Ingest — Converte il documento sorgente in un corpus di pagine indirizzabile per riga (un file markdown per pagina), così ogni valore estratto può essere ricondotto alla sua posizione esatta.
- Segment — Rileva i confini delle sezioni usando una definizione tassonomica, suddividendo il corpus in porzioni gestibili che l’agente legge una alla volta.
- Record — Man mano che l’agente legge ogni sezione, registra i valori estratti. Lo strumento li normalizza automaticamente — valute, date e identificativi vengono convertiti nel formato di archiviazione standard — e associa a ciascun valore la pagina e l’intervallo di righe.
- Consolidate — Unisce tutte le estrazioni delle sezioni in un unico
variables.json. Quando la stessa variabile appare in più sezioni, la risoluzione dei conflitti seleziona il candidato migliore in base a validità, specificità e priorità della sezione. - Double-check — Scansiona il corpus alla ricerca di variabili ancora nulle dopo il consolidamento, usando pattern sensibili al formato per far emergere candidati che l’agente potrebbe aver tralasciato.
Ogni valore nell’output finale include la provenienza completa: quale pagina, quali righe, quale sezione e come sono stati risolti i conflitti. Il risultato si collega direttamente allo strumento validate_variables del motore di template per un flusso estrazione-e-generazione senza interruzioni.
Strumenti DOCX
Una nuova skill docx-tools fornisce all’agente nove strumenti per lavorare con documenti Word:
- Build — Crea file
.docxprogrammaticamente con pieno controllo su paragrafi, tabelle, intestazioni, piè di pagina, elenchi e stili. - Unpack / Pack — Estrae un
.docxin file XML modificabili (con pretty-printing automatico) e li ricomprime in un.docxvalido. Utile per modifiche di formattazione precise che vanno oltre ciò che offre lo strumento build di alto livello. - Extract text — Estrae il contenuto del documento come Markdown, con controllo sulle revisioni: mostra tutto il markup, accetta la versione finale o ripristina l’originale.
- Accept changes — Accetta tutte le revisioni, producendo un documento pulito senza segni di revisione.
- Add comment — Ancora commenti di revisione a porzioni specifiche di testo, con supporto per risposte in thread.
- Validate — Controlla la struttura del documento per file mancanti, contenuti malformati, ID duplicati e relazioni interrotte, con riparazione automatica opzionale.
- Convert — Converte tra
.doc,.docx, PDF, HTML e ODT.
La skill si installa dalla libreria come qualsiasi altra e include guide di riferimento affinché l’agente possa costruire documenti complessi senza aiuto esterno.
Grazie per usare Rakenne. Queste tre funzionalità lavorano insieme come una pipeline: estrarre variabili da un documento sorgente, generarle in un template ed esportare il risultato come un file Word rifinito. Ci piacerebbe sapere come le mettete in pratica.
— Il team Rakenne