0

我正在研究一个剽窃检测项目。我需要使用 Stanford Parser API 来获取存储在文本文件中的句子中单词的词性 (POS) 标签。

我了解该课程edu.Stanford.nlp.parser.lexparser.LexicalizedParser可用于此目的。但我无法让它工作。

谁能告诉我如何在 java 中编写一个可以利用此类或 API 中可用的其他类来获取 POS 标签的代码?

非常感谢

4

2 回答 2

1

查看启动文件ParserDemo.javaParserDemo2.java包含在发行版中。它们显示了在代码中调用解析器的简单示例。特别是,ParserDemo2.java请参阅 call parse.taggedYield(),它返回 a Listof TaggedWord,您可以从中请求tag()每个项目的 the 。

但是,如果您只想要一个词性标注器,您会发现只使用一个词性标注器(例如斯坦福词性标注器)会更快且内存占用更少。

于 2012-12-16T15:09:54.143 回答
0

Javadoc 可以在这里找到:http://nlp.stanford.edu/nlp/javadoc/javanlp/edu/stanford/nlp/parser/lexparser/package-summary.html. 请注意,包名 ( edu.stanford.nlp.parser.lexparser) 区分大小写,并且您已编写Stanford. 这将意味着你得到“ClassNotFoundException”。

您不提供任何其他信息或错误消息,因此很难提供进一步的帮助。您需要帮助编译和运行 Java 包吗?如果是这样,请在处理 NLP 之前解决该问题。

于 2012-12-15T17:40:37.173 回答