doct
doct
doct
模块用于解析docx文件
docx 对象
import {docx} from "doct"
方法
readFile(path: string): DocxFile
从本地文件系统读取docx文件。
参数:
path
: docx文件的路径
返回:
Docx
: 解析后的docx对象
示例:
const docFile = docx.readFile("./example.docx")
readBuffer(buffer: Buffer): DocxFile
从内存缓冲区读取docx文件。
参数:
buffer
: 包含docx文件内容的Buffer对象
返回:
Docx
: 解析后的docx对象
示例:
const buffer = fs.readFileSync("./example.docx")
const docFile = docx.readBuffer(buffer)
DocxFile
DocxFile对象表示一个解析后的Word文档,包含文档的内容、样式和关系等信息。该对象由readFile
或readBuffer
方法返回。
方法
slice(size: int): Object
将文档切分为结构化数据
参数:
size
: 每个切片的最大长度
返回:
Object
: 对象,每个对象包含以下属性:id
: 标题唯一标识符name
: 标题文本content
: 标题下的文本内容数组children
: 子标题对象数组
示例:
const docFile = docx.readFile("./example.docx")
const objects = docFile.slice(600)
// 示例输出
[
{
"id": "1",
"name": "一级标题",
"content": [...],
"children": [
{
"id": "1.1",
"name": "二级标题",
"content": [...],
"children": []
}
]
}
]