0


我正在寻找的是一个可以转换word文件格式的文本转换库,pdfs

但是在文本转换后保留它们的格式结构表格结构丢失并且文档变得扭曲

例如

姓名 emailid 电话号码在表格中并在表格中形成一行

转换后,这些在单独的行中,例如
name
emailid
phonenumber

我希望这些以姓名 emailid 电话号码的形式出现

目前我正在使用 apache tikka 它使用 apache poi 我该如何实现这一点

如果可以,我可以逐个元素解析 msword 文档吗?请分享一个例子

问候

拉贾特

4

1 回答 1

2

您可以使用APACHE POI 和 pdf PDF READ 阅读.doc .dox 的内容

然后您可以将该内容写入文本文件

于 2012-07-09T11:50:49.973 回答