-1

我想读取一个 doc 文件并从中获得一些结果。

例如:如果我有一个文件 - file.doc

它有类似的东西

恢复

姓名:约翰·卡特

地址:美国

我是一名 php 开发人员

然后我想要类似的东西:

array(
'name' => john carter
'Address' => USA 
)

并且它也拒绝来自它的其他信息。

可能吗?

我已经尝试过 phpoffice,但我无法得到任何与我的需求相关的东西。

我们可以轻松获取整个文件数据,但我无法识别我想要的任何内容。

我需要类似于 abbyy 提供的图像到文本。

请任何人帮助我。

4

1 回答 1

1

PHP docx reader:将MS Word Docx 文件转换为文本 该类可以将MS Word Docx 文件转换为文本。

它可以从 docx 格式的压缩 Microsoft Word 文件中提取文件。

该类可以解析文档 XML 文件并提取其中包含的文本。

对问题的引用:https ://stackoverflow.com/a/19503654/5212418

于 2016-09-07T12:48:37.410 回答