1

我需要从树结构中提取名词短语,但我无法使用正则表达式模式从树结构中提取名词。

这是树结构

(TOP (ADJP (JJ 欢迎) (PP (TO to) (NP (NNP Regular) (NNP Expression) (NNS learnings)))))

我需要提取所有像 NP、NNP、NNS 等 pos 标签的词;我需要使用正则表达式模式获取正则、表达式、学习等单词。

有人可以帮我如何得到这个。

4

1 回答 1

1

不确定这是否是您想要的,但这会为您提取这些词:

Pattern regexpPattern = Pattern.compile("([A-Z]?[a-z]+)\\)");
Matcher m = regexpPattern.matcher("your string");
while (m.find()) {
    System.out.println(m.group(1));
}
于 2013-02-21T11:43:40.873 回答