我有一个pdf文件:
由 Aspose.pdf 转换为 word 并输出为:
https://ufile.io/ikwgx 为什么从 pdf 转换为 word 后,word 的文本超出区域并且文本是组格式。
如何编辑此代码以实现我的目标?
我的代码是:
Document document = new Document("x"+".pdf");
document.save("x" + ".docx", SaveFormat.DocX);
我有一个pdf文件:
由 Aspose.pdf 转换为 word 并输出为:
https://ufile.io/ikwgx 为什么从 pdf 转换为 word 后,word 的文本超出区域并且文本是组格式。
如何编辑此代码以实现我的目标?
我的代码是:
Document document = new Document("x"+".pdf");
document.save("x" + ".docx", SaveFormat.DocX);
对于文本分组问题,我测试了这段代码并解决了我的问题:
DocSaveOptions saveOptions = new DocSaveOptions();
saveOptions.setMode(DocSaveOptions.RecognitionMode.Flow);
saveOptions.setFormat(DocSaveOptions.DocFormat.DocX);
document.save(Constants.EXP_DIR + token + ".docx", saveOptions);
但是对于表格外的文本问题,我仍然有问题。