希望有人对如何解析 xfa 文件有一些信息。我可以很好地解析 csv 或 xml 文件,但是出现了一个 xfa 文件,我不熟悉这种格式。看起来像制表符分隔的正文,顶部有列元数据。
任何人之前都处理过这些问题,或者可以指导我如何解析它们?
我使用 vb.net,但任何解决方案的语言都不太相关。
非常感激。
嗯,好像没有人知道。问题是 .xfa 看起来不像一个“标准”扩展名:毕竟,任何人都可以创建自己的扩展名,从 .xyz 到 .something...
我环顾四周,毫不意外地发现(“x”)是一种带有此扩展名的 XML 格式,仅此而已。
指出这种文件来自哪里,它包含什么样的数据,可能会有所帮助。或不。
您将文件描述为带有标题的简单 TSV(制表符分隔值)。使用标记器或一些正则表达式进行解析非常简单,所以我不确定你卡在哪里。
我想你可能在谈论这个:http ://en.wikipedia.org/wiki/XFA_forms
这似乎是一个旨在处理该模板的页面:http: //www.w3.org/1999/05/XFA/xfa-template-19990614
这些信息应该足以让球滚动起来。如果失败了,那么您总是可以分析文件本身的模式并从那里开始。我不认为这太棘手。
无论如何,我希望这会有所帮助。
PS 如果您可以提供指向该 .xfa 的链接,我们可能会为您提供更多帮助。
原始帖子说内容看起来像“顶部有列元数据的制表符分隔的正文”。XFA 表单看起来不像 - XFA 表单通常使用 *.xdp 扩展名并且是 XML。
查看 Adobe 页面:
http://partners.adobe.com/public/developer/xml/index_arch.html
(Adobe XML Forms Architecture,目前 1400 页)
让 LiveCycle/Acrobat 为您解析它。