KNIME 带有几个本地节点,用于执行不同的标记任务,例如 POS 标记或命名实体识别。为了使用已识别的标签或术语,您可以使用 Bag of Words 节点,该节点生成术语(不是单词)和相关标签。但是,这种方法没有详细说明哪个标签与每个单词相关联,也没有详细说明标签(或单词)的顺序。
因此,如果您想提取诸如“相对于实际单词的 POS 标签 +/- N 个单词”之类的特征(例如单词窗口),您该怎么做?
例如,对于“那个城市是纽约”,我希望 KNIME 生成一个有序列表,例如:(最后一个 NN 将是一个命名实体)。