Rakenne 0.5.0 — Motor de templates, extração de variáveis e ferramentas DOCX
0.5.0 introduz um motor de templates orientado por schema para renderizar documentos estruturados, um pipeline de extração com rastreabilidade completa para capturar variáveis de documentos-fonte, e um conjunto completo de ferramentas para criar e editar arquivos Word.
Temos o prazer de anunciar o Rakenne 0.5.0. Esta versão adiciona três grandes capacidades: um motor de templates para renderizar documentos estruturados a partir de variáveis validadas, um pipeline de extração para capturar dados de variáveis de documentos-fonte com rastreabilidade completa, e uma skill de ferramentas DOCX para criar, editar e converter arquivos Word.
Motor de templates
As skills agora podem definir um schema de variáveis e templates de documentos para sua saída. O agente usa quatro novas ferramentas para validar, verificar, renderizar e auditar o resultado:
- Validate variables — Verifica os valores das variáveis contra o schema. Suporta tipos ricos (moeda, datas, CNPJ, CPF, percentuais, tabelas markdown) e reporta a taxa de preenchimento para você saber o quão completos estão os dados antes da renderização.
- Lint template — Detecta erros antes da renderização: helpers ausentes, variáveis indefinidas, valores opcionais sem texto de fallback. Reporta problemas com referências de arquivo e linha para o agente corrigi-los no local.
- Render template — Substitui as variáveis validadas no template com formatação sensível ao idioma (ex.:
R$ 1.500.000,00para português brasileiro,$1,500,000.00para inglês). Variáveis derivadas são calculadas automaticamente a partir de suas fontes. - Audit render — Compara a saída renderizada com o template original. Valida que zonas imutáveis (disclaimers regulatórios, cláusulas padronizadas) permanecem inalteradas, executa verificações anti-contaminação e impõe limites de alteração para que o agente permaneça dentro dos limites esperados.
Os templates suportam partials, seções condicionais e mais de 40 helpers de formatação sensíveis ao idioma. O motor é determinístico — as mesmas entradas sempre produzem a mesma saída.
Extração de variáveis
Um novo pipeline de oito ferramentas permite ao agente extrair variáveis estruturadas de documentos-fonte (PDF, DOCX ou outros formatos) e produzir um arquivo variables.json pronto para o motor de templates:
- Ingest — Converte o documento-fonte em um corpus de páginas endereçáveis por linha (um arquivo markdown por página) para que cada valor extraído possa ser rastreado até sua localização exata.
- Segment — Detecta limites de seção usando uma definição de taxonomia, dividindo o corpus em partes gerenciáveis que o agente lê uma por vez.
- Record — Conforme o agente lê cada seção, ele registra os valores extraídos. A ferramenta os normaliza automaticamente — moedas, datas e identificadores são convertidos para seu formato de armazenamento padrão — e marca cada valor com sua página e intervalo de linhas.
- Consolidate — Mescla todas as extrações de seções em um único
variables.json. Quando a mesma variável aparece em múltiplas seções, a resolução de conflitos escolhe o melhor candidato com base em validade, especificidade e prioridade da seção. - Double-check — Varre o corpus em busca de variáveis ainda nulas após a consolidação, usando padrões sensíveis a formato para identificar candidatos que o agente possa ter deixado passar.
Cada valor na saída final carrega proveniência completa: qual página, quais linhas, qual seção e como os conflitos foram resolvidos. O resultado conecta-se diretamente à ferramenta validate_variables do motor de templates para um fluxo contínuo de extração e renderização.
Ferramentas DOCX
Uma nova skill docx-tools oferece ao agente nove ferramentas para trabalhar com documentos Word:
- Build — Crie arquivos
.docxprogramaticamente com controle total sobre parágrafos, tabelas, cabeçalhos, rodapés, listas e estilos. - Unpack / Pack — Extraia um
.docxem arquivos XML editáveis (com pretty-printing automático) e recompacte-os em um.docxválido. Útil para ajustes precisos de formatação que vão além do que a ferramenta de construção de alto nível oferece. - Extract text — Extraia o conteúdo do documento como Markdown, com controle sobre alterações rastreadas: exibir toda a marcação, aceitar versão final ou rejeitar para o original.
- Accept changes — Aceite todas as alterações rastreadas, produzindo um documento limpo sem marcas de revisão.
- Add comment — Ancore comentários de revisão a trechos específicos do texto, com suporte a respostas encadeadas.
- Validate — Verifique a estrutura do documento em busca de arquivos ausentes, conteúdo malformado, IDs duplicados e relacionamentos quebrados, com reparo automático opcional.
- Convert — Converta entre
.doc,.docx, PDF, HTML e ODT.
A skill é instalada pela biblioteca como qualquer outra e inclui guias de referência para que o agente possa construir documentos complexos sem ajuda externa.
Obrigado por usar o Rakenne. Essas três funcionalidades trabalham juntas como um pipeline — extraia variáveis de um documento-fonte, renderize-as em um template e exporte o resultado como um arquivo Word finalizado. Adoraríamos ouvir como você as utiliza.
— A equipe Rakenne