0

我正在尝试执行以下操作,但我的 ExecuteStreamCommand 出现错误:

Cannot run program "C:\Python36\pythonscript.py" error=193 not a valid Win32 application"

这是在我家的 Windows 工作站上运行的。

  1. GetFile(获取我的 PDF)
  2. ExecuteStreamCommand(调用 Python 脚本用 Tika 解析 PDF,并创建 JSON 文件)
  3. PutFile(输出文件包含我稍后将使用的 JSON)

NiFi 有内置的 PDF 解析器吗?有没有比 Tika 更兼容 NiFi 的东西?

如果没有,我如何从 ExecuteStreamCommand 调用一个?

提前致以问候和感谢!

4

2 回答 2

0

带有从 NiFi 触发的 tika 模块的 Python 脚本是解析 pdf 的一个很好的解决方案,因为目前 NiFi 中没有可用的内置选项。

您还可以尝试 Python 中的其他模块,例如 PyPDF2 或 pdfminer。

稍后,可以ExecuteSteamCommand使用属性选项卡在处理器中配置脚本,如下所示。

Command Path: path/to/python

Command Arguments: /path/to/pdf-parser.py

Ignore STDIN: false
于 2021-12-01T11:38:59.270 回答
0

无法运行程序“C:\Python36\pythonscript.py”错误=193 不是有效的 Win32 应用程序”

您需要将 Python 可执行文件的引用添加到要运行的命令中,ExecuteStreamCommand因为您无法使用 shebang 在 Windows 上运行 Python 脚本(例如在 Linux 上的#!/usr/bin/python )。

于 2020-11-20T13:33:04.213 回答