我需要一些帮助来解决这个问题。
我们有大量给定指定域的文档。这些文档来自不同的来源,因此它们的结构也可能非常不同。另一方面,我有一个包含一些指定字段的表格,其中一些数字必须从文档的摘录中填写。
例如:
x公司2010年的营业额为$20mio,今年y公司的交易额为$1,000,000。
结果应该是这样的
|| Company | Year | Volume
|| X | 2010 | 200,000
|| Y | 2010 | 1000,000
您能否指出一些链接或主题,我可以在其中找到如何解决此类问题的更多信息。
我知道没有开箱即用的解决方案,但我应该从哪里开始寻找。
提前致谢。