我是这个论坛和 Orange 的新手。在这一点上,我现在还不是真的 Python,但我已经准备好学习了。但是,在这种环境中走得更远之前,我想知道它是否能满足我的需求!
我所做的基本上是将 PDF 产品目录“转换”为 Excel 文件,其他软件可以使用这些文件为其他软件创建数据库。
并将其变成这种类型的 xls 表:http: //imgur.com/BtLBkOS
我基本上需要它来检索货号、颜色、尺寸(例如:20x20)。G/B部分是在完成后手动完成的。
所有目录都不相同,所以我使用 pdftotext、RegEx 和 Notepad++ 整理了一些但我想知道这个数据挖掘解决方案是否可以解决?