0

我想将 .docx 文件转换为 .txt 并且如果 .docx 有表我想在 .txt 文件中以良好的方式维护它们,所以我为此目的使用 pypandoc。在我当地,这就像魅力一样。当我将其与所有依赖项一起压缩并将其放入 s3 以通过 aws lambda 运行时,它会失败并出现以下错误:

未找到 pandoc:安装 pandoc 并将其添加到您的 PATH 或调用 pypandoc.download_pandoc(...) 或安装包含 pandoc 的 pypandoc 轮子

我的代码是这样的:

import boto3
import logging
import pypandoc
local_file_docx =  '/tmp/'+prefix+'german-de.docx'
local_file_txt =  '/tmp/'+prefix+'german-de.txt'
def lambda_handler(event, context):
    print(pypandoc.convert_file(local_file_docx, "plain+simple_tables", format="docx", extra_args= 
    (), encoding='utf-8', outputfile=local_file_txt))

任何帮助。提前升值

4

0 回答 0