4

我可以使用以下代码获取带有命名实体注释的字符串。

String NEString =  classifier.classifyWithInlineXML(fileContents)

我想知道是否有任何方法可以调用,以便我可以在文件中获取单独的实体(PERSON、ORGANIZATION、LOCATIOIN)列表,这样我就不必使用上述方法解析检索到的字符串来获取实体清单?

4

2 回答 2

3

在我看来,运行分类的清理方法是:

List<Triple<String,Integer,Integer>> out = classifier.classifyToCharacterOffsets(text);
triple.first(): entity type
triple.second(): start position
triple.third(): end position

它将后续实体分组并返回实体的开始和结束位置。

于 2014-03-28T00:13:34.210 回答
1

据我所知,有 3 种方法可以获取带注释的字符串:

1)classifier.classifyToString(" ")

2)classifier.classifyWithInlineXML(" ")

3)classifier.classifyToString(" ", "xml", true)

第一个是最容易分开的。不幸的是,没有您希望的任何方法。

于 2013-02-18T11:58:08.823 回答