3

我正在创建一个网站,作者可以在其中创建EPUB文件。用户将以这种.doc格式上传他们的书籍。我需要从中创建 EPUB 文件。一个 doc 文件将包含多个章节。所以我需要解析doc文件并将其分成章节。作者将使用Heading 1他们的章节标题。

那么在 中PHP,有没有办法使用 解析doc文件HTML并将其拆分为章节Heading 1,以便我可以创建 EPUB 文件。

经过一番研究,我得到了一个linux 应用程序。但我认为,它会将文档转换为纯文本。所以我将无法拆分章节。

如果你有,请给我建议一个解决方案。提前致谢。

4

1 回答 1

1

您可以使用PHPDOCX API来实现这一点。

首先尝试使用函数参考从您的 Word 文档生成 XHTML

像这样的东西。。

require_once '../../classes/TransformDoc.inc';

$document = new TransformDoc();
$document->setStrFile('../files/Text.docx');
$document->generateXHTML();
$document->validatorXHTML();
echo $document->getStrXHTML();

获取 XHTML 内容后,您可以进行各种处理,如删除章节等。

完整的文档可以在这里找到。

于 2013-08-20T06:12:27.417 回答