Python - 处理 Word 文档
-
简述
要阅读 word 文档,我们需要名为 docx 的模块的帮助。我们首先安装docx,如下图。然后编写一个程序,使用 docx 模块中的不同函数逐段读取整个文件。我们使用以下命令将 docx 模块放入我们的环境中。在下面的示例中,我们通过将每一行附加到段落并最终打印出所有段落文本来读取 word 文档的内容。当我们运行上述程序时,我们得到以下输出 - -
阅读个别段落
我们可以使用段落属性从 word 文档中读取特定段落。在下面的示例中,我们仅从 word 文档中读取第二段。当我们运行上述程序时,我们得到以下输出 -