Rakenne 0.5.0 — 模板引擎、变量提取与 DOCX 工具

0.5.0 引入基于模式的模板引擎用于渲染结构化文档,提供具备完整溯源能力的提取管道从源文档中提取变量,并新增一整套用于创建和编辑 Word 文件的工具。

  • 版本: 0.5.0
  • 2026-03-05
作者 Ricardo Cabral · Founder

我们很高兴宣布 Rakenne 0.5.0。本次发布新增三大核心能力:用于从已验证变量渲染结构化文档的 模板引擎,用于从源文档中提取变量数据并提供完整溯源的 提取管道,以及用于创建、编辑和转换 Word 文件的 DOCX 工具 技能。

模板引擎

技能现在可以为其输出定义 变量模式文档模板。代理使用四个新工具来验证、检查、渲染和审计结果:

  • Validate variables — 根据模式检查变量值。支持丰富的数据类型(货币、日期、CNPJ、CPF、百分比、Markdown 表格),并报告填充率,让您在渲染前了解数据的完整程度。
  • Lint template — 在渲染前捕获错误:缺失的辅助函数、未定义的变量、没有回退文本的可选值。问题报告包含文件和行号引用,以便代理就地修复。
  • Render template — 将已验证的变量代入模板,支持本地化格式(例如巴西葡萄牙语使用 R$ 1.500.000,00,英语使用 $1,500,000.00)。派生变量会从其来源自动计算。
  • Audit render — 将渲染输出与原始模板进行对比。验证 不可变区域(法规免责声明、样板条款)是否保持不变,运行反污染检查,并执行变更预算控制以确保代理在预期范围内操作。

模板支持局部模板、条件段落以及超过 40 个本地化格式辅助函数。引擎是确定性的 — 相同的输入始终产生相同的输出。

变量提取

一条由八个工具组成的新管道,可让代理从源文档(PDF、DOCX 或其他格式)中提取结构化变量,并生成可供模板引擎使用的 variables.json 文件:

  • Ingest — 将源文档转换为可按行寻址的页面语料库(每页一个 Markdown 文件),使每个提取的值都可以追溯到其精确位置。
  • Segment — 使用分类定义检测章节边界,将语料库拆分为代理逐一读取的可管理片段。
  • Record — 代理读取每个章节时,记录提取的值。工具会自动进行标准化 — 将货币、日期和标识符转换为标准存储格式 — 并为每个值标注所在的页码和行范围。
  • Consolidate — 将所有章节的提取结果合并为单个 variables.json。当同一变量出现在多个章节中时,冲突解决机制会根据有效性、具体性和章节优先级选择最佳候选值。
  • Double-check — 扫描语料库中在合并后仍为空的变量,使用格式感知的模式来发现代理可能遗漏的候选值。

最终输出中的每个值都携带完整的溯源信息:哪一页、哪几行、哪个章节,以及冲突如何解决。结果可直接传入模板引擎的 validate_variables 工具,实现无缝的提取-渲染工作流。

DOCX 工具

新的 docx-tools 技能为代理提供九个用于处理 Word 文档的工具:

  • Build — 以编程方式创建 .docx 文件,完全控制段落、表格、页眉、页脚、列表和样式。
  • Unpack / Pack — 将 .docx 解压为可编辑的 XML 文件(自动美化格式),并重新打包为有效的 .docx。适用于超出高层级构建工具能力的精确格式调整。
  • Extract text — 以 Markdown 形式提取文档内容,可控制修订标记的处理方式:显示所有标记、接受最终版本或恢复为原始版本。
  • Accept changes — 接受所有修订标记,生成无修订痕迹的干净文档。
  • Add comment — 将审阅批注锚定到指定文本,支持线程回复。
  • Validate — 检查文档结构,查找缺失文件、格式错误的内容、重复 ID 和断开的关联,并支持自动修复。
  • Convert — 在 .doc.docx、PDF、HTML 和 ODT 之间进行格式转换。

该技能可像其他技能一样从技能库安装,并附带参考指南,使代理无需外部帮助即可构建复杂文档。


感谢使用 Rakenne。这三项功能协同组成一条完整管道 — 从源文档提取变量、将变量渲染到模板中、再将结果导出为精美的 Word 文件。我们期待了解您的使用方式。

— Rakenne 团队

准备好让你的专业知识驱动工作流了吗?

告别死板的模板和复杂的工具。用 Markdown 写下你的流程,智能体完成剩下的一切。今天就开始用 Rakenne 构建 AI 文档工作流。

免费开始 — 无需注册