在 Java 中的 Pos Tagging 之后,我有一个单词列表。现在我想删除带有指定标签的特定单词。如何使用字符串标记器来删除标记的单词?比如to-PRP?以及所有带有标签 prp 的单词?
输入文件:
mike-NNS
Buses-NNP
Walk_VRB
to_PRP
. . . . . . . . . 等等
在 Java 中的 Pos Tagging 之后,我有一个单词列表。现在我想删除带有指定标签的特定单词。如何使用字符串标记器来删除标记的单词?比如to-PRP?以及所有带有标签 prp 的单词?
输入文件:
mike-NNS
Buses-NNP
Walk_VRB
to_PRP
. . . . . . . . . 等等
final List<String> result = new ArrayList<String>();
final List<String> textList= getList(); // get your list
final StringTokenizer tokenizer =
new StringTokenizer(textList, delimiter); // your delimiter
while (tokenizer.hasMoreElements()) {
final String token = tokenizer.nextToken();
if (isValid(token)) { // implement your own isValid method
result.add(token);
}
}
return result;