0

我的团队希望将认知搜索应用到大量非结构化“保单”文档(例如,汽车保险保单文档)。这些文档中的一些信息被组织在格式化的表格中。人类读者将使用行和列标题来解释文档。

例如,我的保单承保范围可能会因事故的性质和涉及的车辆而异。在我的解决方案的上下文中,此信息可在政策文档中的表格中获得,表格的行列出了各种类型的事件,列列出了政策涵盖的不同车辆。每个表格单元描述特定事件/车辆组合的覆盖范围。

很自然的做法是用与该单元格的列标题和行标题的关系来注释每个表格单元格。我希望 Watson Discovery 已经做到了这一点,或者可以为我做到这一点。但是,在我的实验中,我没有看到表明情况如此的结果。Discovery 或 Watson Knowledge Studio 中是否有便利利用表中行和列标题中的信息的工具?

4

1 回答 1

0

表格内容是结构化数据,不适合 WKS/Discovery 进行分析。WKS 接受自然语言文本的纯文本。尽管 Discovery 接受 HTML/WORD/PDF 文档,但摄取的文档会在预处理中转换为纯文本,并且所有表格结构都将被删除。因此在文本分析中不考虑表的关系。我建议您将此类表格内容数据作为结构化数据处理,并以其他方法(例如以编程方式)处理它们。

于 2017-07-06T09:13:09.130 回答