Informatica 如何处理 PDF 等非结构化数据源?如果表格报告存储为 PDF,我们可以从 PDF 中将其读取为表格数据(如 .NET 中的数据表)吗?
问问题
4159 次
3 回答
0
您必须使用处理非结构化数据的 Informatica B2B 数据交换产品。该产品提供了处理各种非结构化数据的功能,不仅包括 PDF,还包括 Word、Excel、Star Office、AFP、PostScript、PCL 和 HTML。您必须使用 Informatica B2B 数据转换。
这是供您参考的快速链接。
http://www.informatica.com/us/products/b2b-data-exchange/b2b-data-transformation/
于 2012-04-16T01:37:59.090 回答
0
PDF 实际上在内部是非常结构化的。PDF 规范的最新版本可能会提供一种方法来保存数据以供外部处理,但 PDF 文档的主要目标是描述要打印的文档,因此各种环境和设备都可以打印文档,结果如下:尽可能相似。
除了打印文本和行以形成表格的位置之外,是否提供了任何额外数据,这在很大程度上取决于 PDF 的创建者。
于 2009-04-21T06:44:03.047 回答