# DOCX 工具

> 专业级 DOCX 工具，用于创建、编辑和处理 Word 文档。可创建带完整样式控制的新 .docx 文件，在 XML 层面对现有文件做精细修改，处理修订和批注，在多种格式间转换，并验证 OOXML 结构。



Tags: 文档, DOCX, Word, 转换


## Example Prompts

- 创建包含表格、页眉和自定义样式的专业 Word 文档
- 从 DOCX 文件中提取并审阅修订记录
- 在 Word 文档特定段落添加审阅批注
- 将 .doc 文件转换为 .docx 或 PDF
- 验证并修复 DOCX 文件的 OOXML 结构

URL: https://rakenne.app/zh-cn/skills/docx-tools/index.md

Try this skill: https://rakenne.app/a/?skill=docx-tools



## 概述

DOCX 工具为创建、编辑和处理 Word 文档提供专业支持。

通过该技能，你可以：

- 创建带完整样式、表格与版式控制的新 .docx 文件
- 在 OOXML（XML）层面打开和编辑现有文档，在需要“微创手术”时保持精度
- 阅读、清理并接受修订记录和批注
- 在 .doc、.docx、PDF、HTML、ODT 等格式之间转换
- 在对外发送前验证并修复 OOXML 结构
- 比较同一文档的两个版本，并生成带修订标记的 redline 文件

## 开始使用

将源文件放入项目工作区，然后激活 *DOCX 工具* 技能。代理会一步步引导你完成操作。

### 典型工作流

- **起草一份精致的 Word 文档**：让代理创建一个新的 .docx，并按需要填充章节、标题、表格和样式。底层通过 `docx_build` 构建，确保文件在 Word 中干净打开。
- **审阅修订记录**：当文档有大量编辑历史时，代理可以用 `docx_extract_text` 提供更清爽的 Markdown 视图，或通过 `docx_accept_changes` 将所有修订合并到一个新的最终版本中。
- **XML 级“外科手术”**：遇到复杂的格式或损坏问题时，代理可以先用 `docx_unpack` 解包 XML，直接编辑，再用 `docx_validate` 查找结构问题，最后通过 `docx_pack` 生成新的干净 .docx。
- **安全地转换格式**：需要在 .doc、.docx、PDF、HTML 或 ODT 之间转换并尽量保留结构时，使用 `docx_convert`。
- **用 redline 对比版本**：在修改完合同或报告后，代理可运行 `docx_compare`，生成一个 redline 版本，在 Word 中以“修订”视图打开，方便审阅者快速看出变化。
- **从 PDF 生成图片**：使用 `docx_pdf_to_images`，按页生成 PDF 的 JPEG/PNG 图片，便于视觉检查或嵌入其他文档。

## 工具参考

DOCX 工具技能暴露了十个专用工具。你不必记住它们的名字——代理会自动选择合适的工具——这一节主要说明各自能力。

### 创建新文档

- **`docx_build`**：使用 JavaScript 库 `docx` 以编程方式构建 .docx 文件。适用于需要精确定义结构的文档（合同、报告、模板），可细致控制章节、段落、表格和样式。

### 读取和清理内容

- **`docx_extract_text`**：将 .docx 文件中的文本提取为 Markdown。你可以选择：
  - 同时展示插入和删除内容，
  - 只展示最终文本（好像所有修订都已接受），
  - 或只展示原始文本（好像所有修订都已拒绝）。

- **`docx_accept_changes`**：接受一个 .docx 文件中的全部修订，并将结果写入新文件。适用于需要一份干净、无历史修订的最终版本。

### XML / OOXML 工作流

当代理需要直接操作 OOXML 时，会组合使用以下工具：

- **`docx_unpack`**：将 .docx 解包为一个可编辑的 XML 目录，合并格式相同的 run，并对 XML 做 pretty-print 以提高可读性。
- **`docx_validate`**：检查 .docx 或已解包目录的结构问题（缺失关键文件、XML 不合法、关系断裂等），并可自动修复常见问题。
- **`docx_pack`**：在验证通过后，将解包的 XML 目录重新打包成新的 .docx 文件。

### 批注与协作

- **`docx_add_comment`**：为已解包文档添加审阅批注或对现有批注的回复。批注锚定在具体文本片段上，在 Word 中会出现在预期位置。

### 转换与比对

- **`docx_convert`**：在无界面模式下调用 LibreOffice，在不同格式间转换文档，例如：
  - `.doc` → `.docx`
  - `.docx` → `pdf`
  - `.docx` → `html`
  - `.odt` → `.docx`

- **`docx_compare`**：比较“原始版”和“修改版”两份 .docx 文档，生成第三个 redline 文档。打开结果文件时，审阅者会看到插入、删除和移动内容都以修订形式呈现。

### PDF 页面转图片

- **`docx_pdf_to_images`**：将 PDF 各页转换为指定分辨率的 JPEG 或 PNG 图片。适合用于视觉 QA、演示文稿，或在其他文档中嵌入页面缩略图。

## 最佳实践

- **不要直接覆盖原始文件**：代理始终写入新路径（例如增加 `_clean`、`_final`、`_redlined` 等后缀），方便你对比与回滚。
- **分享前先做验证**：对于重要的对外文档，建议让代理执行 `docx_validate`，在发送前发现 OOXML 结构问题。
- **在 build 与 XML 之间作出合适选择**：新文档优先使用 `docx_build`，只有在需要底层修复或直接查看 XML 时，再采用解包/验证/重新打包的工作流。



---

Back to [Skill Library](https://rakenne.app/zh-cn/skills/index.md)
