我想知道在使用 namefinder api 时是否可以使用 opennlp 来提取非常具体的上下文。
例如,如果我有两个句子:
26 岁的简史密斯因在当地的塞恩斯伯里偷饼干而被拘留。
26 岁的简·史密斯因勇敢而被授予荣誉勋章。
在这种情况下,我希望 opennlp 不仅检测句子结构(在两个句子中都找到 Jane Smith),而且还得出结论,当在同一个句子中使用“保管”、“偷窃”等词时,这会给出不同的第二句的上下文。因此,如果我将第一句训练为“[START:offender] Jane Smith [END]”,第二句训练为“[START:hero] Jane Smith [END]”,那么在某些时候会根据我训练的句子。
我知道 Opennlp 使用特征提取(从我读过的内容来看,它着眼于句子结构 - 我在这里可能是错的?),但我想知道是否还有一些字典分析,如果我训练了足够多的这些句子,我会最终得到一个好的上下文分割?
如果没有,你能建议任何前进的方式(这是可扩展的)吗?由于许可证,我想尝试继续使用 Opennlp。