问题标签 [phpoffice]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - 如何在 php 中读取 .doc 文件并从中获取特定的单词
我想读取一个 doc 文件并从中获得一些结果。
例如:如果我有一个文件 - file.doc
它有类似的东西
恢复
姓名:约翰·卡特
地址:美国
我是一名 php 开发人员
然后我想要类似的东西:
并且它也拒绝来自它的其他信息。
可能吗?
我已经尝试过 phpoffice,但我无法得到任何与我的需求相关的东西。
我们可以轻松获取整个文件数据,但我无法识别我想要的任何内容。
我需要类似于 abbyy 提供的图像到文本。
请任何人帮助我。
php - laravel excel,有没有比彻底的 mime 类型检查更好的方法来验证上传的文件实际上是电子表格?
我有一个允许用户上传电子表格的工具,然后我用 Laravel-Excel 解析电子表格。我的问题是,如何在尝试解析文件之前检查该文件是否为有效的 excel 文件?
我查看了 PHPOffice/Laravel-Excel 文档,但找不到验证文件的方法。所以,我的下一个猜测是,如果我尝试 Load() 一个无效文件,它会爆炸并给我一个警告或错误。但是,它不会这样做,而是解析文件并尝试以某种方式将其转换为电子表格。例如,我给它提供了一个 pdf,它确实生成了一个集合,其中包含它可以在 pdf 文件中找到的任何非二进制垃圾。这是不可取的。
目前,我正在进行 mime 类型检查以验证文件。
这并不理想,因为似乎有各种各样的可能的 mime 类型,所以我必须积极维护列表,并且某些 csv 文件具有纯文本 mime 类型,因此非 csv-plaintext 文件将在这里通过集合. Laravel、Laravel-Excel 或 PHPOffice 是否提供任何标准方法来验证文件?
pdf - 从 docx 渲染库问题创建 pdf
如果您对此主题有所了解,请发表评论。我正在尝试使用 phpoffice/word 从 docx 获取 pdf 文件。但我不能让它成为现实,因为一整天的测试我只得到这个错误:
请不要告诉我在 www 中查看这个问题,我试过了 - 没有任何帮助。我的代码:
我知道我的问题是库,但我真的不明白这个库的文件在哪里。可能是因为今天我第一次尝试与作曲家合作。我尝试了不同的库,例如 dompdf 和 TCPDF,我也尝试了其他库。所以如果你有任何想法欢迎。=)
php - XML 解析错误;PHPWord
我在我的 Laravel 应用程序中使用 PHPOffice/PHPWord。它用于生成带有表格结果的 .docx 文档。这对于包含 3 个 6 行的表格的文档非常有用,但是当有更多行时,会生成文档,但是在打开它时会发生以下错误:
现在,我已经开始在另一个结果页面上工作,我还想在其中生成一个 .docx 文档。这将包含 5 个表,但有 3 行我得到相同的 XML 解析错误,但在不同的位置(位置:部分:/word/document.xml,行:4,列:2888)。有人可以向我解释这是我的代码中的错误,还是 phpword/words 中的错误?
我通过删除所有内容并慢慢添加新行来完成一些故障排除。我发现了错误,但我该如何解决。前两个表生成良好..
谢谢!
解决方案 好的,所以我删除了整个文档并分别添加了每个句子,以查看错误发生的位置。这导致看到错误来自我得到的数据。它无法处理“>”和“&”符号!
因此,如果您遇到此错误,请检查您正在打印的数据!
php - Yii2:phpoffice/phpexcel 将 .xlsx 文件识别为 HTML
我正在尝试为我的 yii2 项目使用 phpoffice/phpexcel 插件来读取 excel 文件。对于具有 xls 扩展名的文件,该插件可以完美运行,并且我可以读取内容,但是当我尝试使用具有日语文件名和 xlsx 扩展名的文件时,它给了我这样的错误:
DOMDocument::loadHTML():实体中的 CDATA 0x3 中的字符无效,行:1。
我尝试调查 PHPExcel_IOFactory::identify。调查该函数时,我在 IOFactory 类中遇到了 createReaderForFile,当检查此处设置的扩展类型时,它显示为“Excel2007”,但由于某种原因,在该过程的最后,该文件仍被识别为 HTML。
为了进一步描述这个问题,我的文件具有不同的扩展名和名称,但内容基本相同,如下所示:
文件如下:
- あああ.xls(可以阅读)
- あああ.xlsx(看不懂)
- aaaa.xls(可以阅读)
- aaaa.xlsx(可阅读)
只有あああ.xlsx 无法读取,但其他都很好。这是对 phpoffice/phpexcel 插件的某种限制吗?如果是,您能否推荐其他 yii2 扩展,使我能够正确读取 xlsx 和 xls 文件?或者有什么方法可以解决这个问题,以便它可以正确识别文件?
phpword - ZipArchive::close(): 创建临时文件失败: Permission denied nginx
我很想提出一个很好的建议来解决以下问题。对于一个平台,我必须创建 php word 文档,而恰好在 Apache 开发环境中,这段代码可以完美执行;然而,在 nginx 平台上,我不断收到主题提示的错误:
构建非常简单:
我在哪里更改 nginx 文件夹结构中的这些权限才能创建这些文档?
php - 在 PHP 中使用 PHPExcel 读取 PDF 数据
- 如何使用 PHPExcel 从 PDF 中读取数据
- 或者无论如何我可以将PDF转换为excel然后使用PHPExcel读取数据请帮助我,我已经从我想要读取数据的地方附加了PDF文件?
- 我尝试过 PDF Parser、PdfToText 等,但没有像 PHPExcel 那样给出准确的结果
php - PHPExcel 和 PhpSpreadsheet 之间的主要区别是什么?
在PHPOffice的项目中,有两个与电子表格文件格式相关的项目:
PHPExcel 是一个用纯 PHP 编写的库,并提供一组类,允许您写入和读取不同的电子表格文件格式,如 Excel (BIFF) .xls、Excel 2007 (OfficeOpenXML) .xlsx、CSV、Libre/OpenOffice Calc .ods, Gnumeric, PDF, HTML, ... 这个项目是围绕微软的 OpenXML 标准和 PHP 构建的。
和
PhpSpreadsheet 是一个用纯 PHP 编写的库,并提供一组类,允许您读取和写入不同的电子表格文件格式,如 Excel 和 LibreOffice Calc。
它们之间的主要区别是什么?
php - 如何使用 PHP 从 word 文档中提取文本内容?
我想用 PHP 从 word 文档中提取文本内容。
我在 Microsoft Word for Mac 2011 中创建了一个新的 Word 文档。编辑:还通过在 Windows 7 下的 Microsoft Word 中创建相同的文档进行了测试。
文件的内容是
我已将它作为 Word 97-2004 文档 (.doc) 保存到磁盘。
我正在使用phpoffice/phpword和这段代码来提取文本:
此代码的输出只是文本的一部分:
代码有问题,还是某种兼容性问题?
编辑:
如果我在输出var_dump($els);
之前添加一个foreach ($els as $e) {
是这样的:
php - 如何用phpword从右到左输入
我需要从右到左的方向写word文档..有什么帮助吗?
我已经从 http://phpword.codeplex.com/SourceControl/list/changesets?branch=default上传了文件“phpword”