0

我是这个论坛和 Orange 的新手。在这一点上,我现在还不是真的 Python,但我已经准备好学习了。但是,在这种环境中走得更远之前,我想知道它是否能满足我的需求!

我所做的基本上是将 PDF 产品目录“转换”为 Excel 文件,其他软件可以使用这些文件为其他软件创建数据库。

我有 PDF 中的瓷砖目录,就像这个:在此处输入图像描述

并将其变成这种类型的 xls 表:http: //imgur.com/BtLBkOS

我基本上需要它来检索货号、颜色、尺寸(例如:20x20)。G/B部分是在完成后手动完成的。

所有目录都不相同,所以我使用 pdftotext、RegEx 和 Notepad++ 整理了一些但我想知道这个数据挖掘解决方案是否可以解决?

4

1 回答 1

0

Orange 不支持阅读 PDF 文件。您将不得不使用专门的实用程序或自己编程。

于 2015-07-28T07:56:03.017 回答