0

我正在研究 Java String Tokenizer。我正在寻找找到段落结尾的方法。

例如,我有一个文本文件..

HI
I am bob the the bob

And I am am  bob bob bob lu the the 

hello

我正在阅读 txt 文件,我正在使用 String Tokenizer 将每个单词放入哈希表

但是,我想在段落结束时停止。例如,

首先,我想存储

"HI
I am bob the the bob" 

其次,当我们看到双换行符时,我们会停下来。并在哈希表中插入“1”。然后我想插入

"And I am am  bob bob bob lu the the "

第三,当我们再次看到双换行符时,我们再次停止。我们在哈希表中插入“2”

然后

我们将“hello”插入哈希表。

但是,我不确定在每段末尾停止的方式?

有人知道怎么做吗?

4

2 回答 2

0

检测双新行不是 sring tokenizer 的职责。您正在使用标记器将一行拆分为单独的单词。但我猜你有一个读取行的外循环。当您检测到空行时,段落结束。

while((line = reader.readLine()) != null) {
   if ("".equals(line.trim())) {
      // empty line  - new paragraph. 
   }
} 
于 2012-09-11T08:40:15.530 回答
0

我想您正在使用空格(“”)作为分隔符。我会尝试使用带有“\n”作为分隔符的第二个 Tokenizer,用它解析文件,然后对每个标记使用你的分隔符。

事实上,在使用第一个分词器后,分词之间的每一个空行都是段落的结尾

于 2012-09-11T08:37:29.800 回答