1

我正在尝试制作一个简单的程序来计算单词、某些字符串和句子。我有计数器这个词,我有一个计数器来计算某些字符串,但是,我不知道如何计算句子,因为基本上如果我计算所有小数,如果有多个“.”。

到目前为止,这是我的代码..

int count = 0;
// while there is something in the file, keep reading and counting
while (inputFile.hasNext()) {
   String token = inputFile.next();
   count++;
}

int letters = 0;
Scanner scanner = new Scanner(file);
while (scanner.hasNextLine()) {
    String nextToken = scanner.next();
    if (nextToken.equalsIgnoreCase("for"))
    {
    letters++;
    }

}
4

1 回答 1

0

这里有一些答案 -使用 StringTokenizer、regex、BreakIterator 等的Java 简单句子解析器- 但真正的故事是:识别句子不是一项简单的任务,如果你想真正找到它们。想想一个真正的长句子,同时使用引号和数字。

您可以尝试几个库,从Sentence Parser到 NLP 更复杂的库,例如 lingpipe、weka 和 gate。(见http://www.quora.com/What-are-the-best-Java-open-source-NLP-toolkits

这完全取决于你想在这方面走多远。

于 2014-10-17T23:01:56.200 回答