我是斯坦福 POS 标记器的新手。
我需要从我的 java 程序中调用标记器并将输出定向到文本文件。我已经从 Stanford-postagger 中提取了源文件并尝试调用 maxentTagger,但我发现的只是错误和警告。
有人可以从头告诉我如何在我的程序中调用 maxentTagger,如果需要设置类路径和其他类似步骤。请帮帮我。
我是斯坦福 POS 标记器的新手。
我需要从我的 java 程序中调用标记器并将输出定向到文本文件。我已经从 Stanford-postagger 中提取了源文件并尝试调用 maxentTagger,但我发现的只是错误和警告。
有人可以从头告诉我如何在我的程序中调用 maxentTagger,如果需要设置类路径和其他类似步骤。请帮帮我。
那么,当您编译或调用您的程序时,您需要将斯坦福的 JAR 文件添加到您的类路径中,例如:
java -classpath stanford-postagger.jar [MyProgram]
然后在你的代码中你需要导入相关的包,你需要的大多数东西似乎都在edu.stanford.nlp.tagger.maxent
.
MaxentTagger
JavaDoc中很好地描述了实例化一个新的,但我将在这里重复一些:
要创建一个新的标注器:
MaxentTagger tagger = new MaxentTagger("models/left3words-wsj-0-18.tagger");
String
用这个标记 a tagger
:
String taggedString = tagger.tagString("Here's a tagged string.")
此外,您可以使用斯坦福的 NLP 工具创建和标记句子。通过使用 a 读取文件来创建句子BufferedReader
:
Sentence sentence = Sentence.readOneSentence(in); // in is a BufferedReader
然后将句子标记为您的tagger
:
Sentence taggedSentence = tagger.tagSentence(sentence);