我正在寻找的是一个可以转换word文件格式的文本转换库,pdfs
但是在文本转换后保留它们的格式结构表格结构丢失并且文档变得扭曲
例如
姓名 emailid 电话号码在表格中并在表格中形成一行
转换后,这些在单独的行中,例如
name
emailid
phonenumber
我希望这些以姓名 emailid 电话号码的形式出现
目前我正在使用 apache tikka 它使用 apache poi 我该如何实现这一点
如果可以,我可以逐个元素解析 msword 文档吗?请分享一个例子
问候
拉贾特