我想从 MSword 03 或更早版本中获取文本内容。有没有可以做到这一点的脚本或软件包?
我能够从 2007 年文档的 word 文件中获取文本。我无法从旧版本(.doc)中获得相同的结果。
我正在使用 apache2 和 php mysql。
Try catdoc
,它将任何 .doc 文件转换为纯文本。请参阅catdoc 主页。
这是一个用于 ms word 文档的 PHP 类,位于http://obninsk.name/obninsk_doc/。
您可以使用 LiveDocx 处理所有 MS Word 文件,包括 RTF http://www.phplivedocx.org/2009/08/13/convert-docx-doc-rtf-to-html-in-php/