我想使用 Python 脚本在 MS Word 文档中处理一些双向文本(乌尔都语和英语),该脚本将文本转换为表格标记。我无法直接访问 Word 文档中的双向文本,因为它是二进制格式,即使我将 Word 文档中的文本复制粘贴到文本编辑器,所有双向文本都会错误地呈现方向性。
例子:
以下文本从我复制它的原始 MSWord 文本(涉及乌尔都语文本)以相反的方向呈现:
图片 پر ہے۔
那么如何处理这样的双向文本,以便在像notepad++这样的文本编辑器中正确呈现,从而可以用Python脚本忠实地处理呢?