我可以使用以下代码获取带有命名实体注释的字符串。
String NEString = classifier.classifyWithInlineXML(fileContents)
我想知道是否有任何方法可以调用,以便我可以在文件中获取单独的实体(PERSON、ORGANIZATION、LOCATIOIN)列表,这样我就不必使用上述方法解析检索到的字符串来获取实体清单?
我可以使用以下代码获取带有命名实体注释的字符串。
String NEString = classifier.classifyWithInlineXML(fileContents)
我想知道是否有任何方法可以调用,以便我可以在文件中获取单独的实体(PERSON、ORGANIZATION、LOCATIOIN)列表,这样我就不必使用上述方法解析检索到的字符串来获取实体清单?
在我看来,运行分类的清理方法是:
List<Triple<String,Integer,Integer>> out = classifier.classifyToCharacterOffsets(text);
triple.first(): entity type
triple.second(): start position
triple.third(): end position
它将后续实体分组并返回实体的开始和结束位置。
据我所知,有 3 种方法可以获取带注释的字符串:
1)classifier.classifyToString(" ")
2)classifier.classifyWithInlineXML(" ")
3)classifier.classifyToString(" ", "xml", true)
第一个是最容易分开的。不幸的是,没有您希望的任何方法。