3

有谁知道一个 python 库来读取 docx 文件?

我有一个我正在尝试从中读取数据的 word 文档。

4

3 回答 3

3

python-docx 可以读写。

doc = docx.Document('myfile.docx')
allText = []
for docpara in doc.paragraphs:
    allText.append(docpara.text)

现在所有段落都将在列表 allText 中。

感谢 Al Sweigart 的“如何使用 Python 自动化无聊的东西”的指针。

于 2015-08-26T16:39:15.463 回答
1

快速搜索 PyPI会找到docx包。

于 2015-03-27T19:58:00.843 回答
1
import docx

def main():
    try:
        doc = docx.Document('test.docx')  # Creating word reader object.
        data = ""
        fullText = []
        for para in doc.paragraphs:
            fullText.append(para.text)
            data = '\n'.join(fullText)

        print(data)

    except IOError:
        print('There was an error opening the file!')
        return


if __name__ == '__main__':
    main()

并且不要忘记使用 (pip install python-docx) 安装 python- docx

于 2019-11-30T12:43:44.683 回答