0

如果文本在一个句子或段落中包含多个术语,我正在 Watson Explorer Content Analytics Studio 中寻找一种方法来生成相同类型的多个注释。我没有超过一个注释,我可以让它选择所有“文本容器”,但它仍然会产生一个注释。我尝试“在此级别触发所有规则”,但这也没有给出预期的结果

下面是一些示例

作业将是“bonjour France”一书的第1,2和4章

重温《大历史》一书第 2 章的第 2 和第 3 段

第1至3章的内容将作为测试的一部分

下周的作业是阅读教科书的第 1,2 和 5 页

到目前为止,我有以下助手(见截图)

在此处输入图像描述

第一行的预期结果是 3 个具有值/特征的 SinglePieceOfContent 类型的注释:

  1. 第 1 章书“你好法国”
  2. 第 2 章书“你好法国”
  3. 第 4 章书“你好法国”

我想避免构建自定义注释器,但如果这是要走的路,我希望得到确认。

4

1 回答 1

1

有两种方法可以做到这一点,两者都有点笨拙,可能不适用于您的特定数据。

第一种方法是您可以使用单个选择规则创建多个注释。所以这样做的蛮力方法是有一个看起来像这样的选择器(高级,忽略干预标记)。首先选择你要在一个句子中做的最大注释数量,比如 5 个,然后:

Selection:
find   chapter chapter? chapter? chapter? chapter? book
rule   create 5 annotations, each with limited span over just the N they refer to and add book covered text as a feature to each. 

第二种方法是使用更新。创建一个标识每个章节的注释,并包含一个设置为“默认”的字符串功能手册。创建另一个标识书籍的注释。然后创建一个这样的聚合规则:

selection:   chapter*  book
rule:    here just drag the value of book to update the feature value currently set to default. 

实际上没有创建任何规则,它是一个更新。更新可以一次处理多个注释。

于 2017-09-28T15:46:45.110 回答