doct

doct

doct模块用于解析docx文件

docx 对象

import {docx} from "doct"

方法

readFile(path: string): DocxFile

从本地文件系统读取docx文件。

参数:

  • path: docx文件的路径

返回:

  • Docx: 解析后的docx对象

示例:

const docFile = docx.readFile("./example.docx")

readBuffer(buffer: Buffer): DocxFile

从内存缓冲区读取docx文件。

参数:

  • buffer: 包含docx文件内容的Buffer对象

返回:

  • Docx: 解析后的docx对象

示例:

const buffer = fs.readFileSync("./example.docx")
const docFile = docx.readBuffer(buffer)

DocxFile

DocxFile对象表示一个解析后的Word文档,包含文档的内容、样式和关系等信息。该对象由readFilereadBuffer方法返回。

方法

slice(size: int): Object

将文档切分为结构化数据

参数:

  • size: 每个切片的最大长度

返回:

  • Object: 对象,每个对象包含以下属性:
    • id: 标题唯一标识符
    • name: 标题文本
    • content: 标题下的文本内容数组
    • children: 子标题对象数组

示例:

const docFile = docx.readFile("./example.docx")
const objects = docFile.slice(600)

// 示例输出
[
  {
    "id": "1",
    "name": "一级标题",
    "content": [...],
    "children": [
      {
        "id": "1.1",
        "name": "二级标题",
        "content": [...],
        "children": []
      }
    ]
  }
]
更新时间 12/31/2024, 2:18:27 PM