浏览技能
Example Conversation
概述
DOCX 工具为创建、编辑和处理 Word 文档提供专业支持。
通过该技能,你可以:
- 创建带完整样式、表格与版式控制的新 .docx 文件
- 在 OOXML(XML)层面打开和编辑现有文档,在需要“微创手术”时保持精度
- 阅读、清理并接受修订记录和批注
- 在 .doc、.docx、PDF、HTML、ODT 等格式之间转换
- 在对外发送前验证并修复 OOXML 结构
- 比较同一文档的两个版本,并生成带修订标记的 redline 文件
开始使用
将源文件放入项目工作区,然后激活 DOCX 工具 技能。代理会一步步引导你完成操作。
典型工作流
- 起草一份精致的 Word 文档:让代理创建一个新的 .docx,并按需要填充章节、标题、表格和样式。底层通过
docx_build构建,确保文件在 Word 中干净打开。 - 审阅修订记录:当文档有大量编辑历史时,代理可以用
docx_extract_text提供更清爽的 Markdown 视图,或通过docx_accept_changes将所有修订合并到一个新的最终版本中。 - XML 级“外科手术”:遇到复杂的格式或损坏问题时,代理可以先用
docx_unpack解包 XML,直接编辑,再用docx_validate查找结构问题,最后通过docx_pack生成新的干净 .docx。 - 安全地转换格式:需要在 .doc、.docx、PDF、HTML 或 ODT 之间转换并尽量保留结构时,使用
docx_convert。 - 用 redline 对比版本:在修改完合同或报告后,代理可运行
docx_compare,生成一个 redline 版本,在 Word 中以“修订”视图打开,方便审阅者快速看出变化。 - 从 PDF 生成图片:使用
docx_pdf_to_images,按页生成 PDF 的 JPEG/PNG 图片,便于视觉检查或嵌入其他文档。
工具参考
DOCX 工具技能暴露了十个专用工具。你不必记住它们的名字——代理会自动选择合适的工具——这一节主要说明各自能力。
创建新文档
docx_build:使用 JavaScript 库docx以编程方式构建 .docx 文件。适用于需要精确定义结构的文档(合同、报告、模板),可细致控制章节、段落、表格和样式。
读取和清理内容
docx_extract_text:将 .docx 文件中的文本提取为 Markdown。你可以选择:- 同时展示插入和删除内容,
- 只展示最终文本(好像所有修订都已接受),
- 或只展示原始文本(好像所有修订都已拒绝)。
docx_accept_changes:接受一个 .docx 文件中的全部修订,并将结果写入新文件。适用于需要一份干净、无历史修订的最终版本。
XML / OOXML 工作流
当代理需要直接操作 OOXML 时,会组合使用以下工具:
docx_unpack:将 .docx 解包为一个可编辑的 XML 目录,合并格式相同的 run,并对 XML 做 pretty-print 以提高可读性。docx_validate:检查 .docx 或已解包目录的结构问题(缺失关键文件、XML 不合法、关系断裂等),并可自动修复常见问题。docx_pack:在验证通过后,将解包的 XML 目录重新打包成新的 .docx 文件。
批注与协作
docx_add_comment:为已解包文档添加审阅批注或对现有批注的回复。批注锚定在具体文本片段上,在 Word 中会出现在预期位置。
转换与比对
docx_convert:在无界面模式下调用 LibreOffice,在不同格式间转换文档,例如:.doc→.docx.docx→pdf.docx→html.odt→.docx
docx_compare:比较“原始版”和“修改版”两份 .docx 文档,生成第三个 redline 文档。打开结果文件时,审阅者会看到插入、删除和移动内容都以修订形式呈现。
PDF 页面转图片
docx_pdf_to_images:将 PDF 各页转换为指定分辨率的 JPEG 或 PNG 图片。适合用于视觉 QA、演示文稿,或在其他文档中嵌入页面缩略图。
最佳实践
- 不要直接覆盖原始文件:代理始终写入新路径(例如增加
_clean、_final、_redlined等后缀),方便你对比与回滚。 - 分享前先做验证:对于重要的对外文档,建议让代理执行
docx_validate,在发送前发现 OOXML 结构问题。 - 在 build 与 XML 之间作出合适选择:新文档优先使用
docx_build,只有在需要底层修复或直接查看 XML 时,再采用解包/验证/重新打包的工作流。