0

我正在解析各种 .docx 文档,但是我的代码中遇到“\n”时分割段落的部分是在遇到这个奇怪的符号(以黄色圈出)时添加一个新行:

在此处输入图像描述

有人可以告诉我这是什么不可打印的字符,我怎样才能用普通的“”空格替换它?

(我不能只是复制和粘贴它并使用 replace() 函数,因为当我这样做时,字符会被解释为 \n,但正如您所见,如果 Word 真的将该字符解释为输入,它会'已经添加了奇怪的输入符号的倒置 P 字符(当我单击 Word 中的显示不可打印字符按钮时),但事实并非如此。希望我解释了自己,非常感谢您的帮助!)。

4

1 回答 1

0

相信你会发现这个字符是换行符。在python-docx中, 的strparagraph.text表示带有 的换行符"\n"。您可以将它们映射到空格(“”),而不是使用:

paragraph_text = paragraph.text.replace("\n", " ")
于 2021-07-28T17:54:44.903 回答