2

我是斯坦福 POS 标记器的新手。

我需要从我的 java 程序中调用标记器并将输出定向到文本文件。我已经从 Stanford-postagger 中提取了源文件并尝试调用 maxentTagger,但我发现的只是错误和警告。

有人可以从头告诉我如何在我的程序中调用 maxentTagger,如果需要设置类路径和其他类似步骤。请帮帮我。

4

1 回答 1

3

那么,当您编译或调用您的程序时,您需要将斯坦福的 JAR 文件添加到您的类路径中,例如:

java -classpath stanford-postagger.jar [MyProgram]

然后在你的代码中你需要导入相关的包,你需要的大多数东西似乎都在edu.stanford.nlp.tagger.maxent.

MaxentTaggerJavaDoc中很好地描述了实例化一个新的,但我将在这里重复一些:

要创建一个新的标注器:

MaxentTagger tagger = new MaxentTagger("models/left3words-wsj-0-18.tagger");

String用这个标记 a tagger

String taggedString = tagger.tagString("Here's a tagged string.")

此外,您可以使用斯坦福的 NLP 工具创建和标记句子。通过使用 a 读取文件来创建句子BufferedReader

Sentence sentence = Sentence.readOneSentence(in); // in is a BufferedReader

然后将句子标记为您的tagger

Sentence taggedSentence = tagger.tagSentence(sentence);
于 2011-01-09T19:10:39.970 回答