0

我有一个程序从文件中获取输入,将文件中的每个单词保存为标记,然后将每个标记添加到数组列表中。

问题是 arrayList 出现例如 ["cat","dog"," "," ","bird"],我不想要 arrayList 中的空格。

读取的文件设置如下:

cat dog


bird

很明显是空行导致了空格,但是空行是必要的。

无论如何,我的代码如下:

import java.io.BufferedReader;
import java.io.DataInputStream;
import java.io.FileInputStream;
import java.io.InputStreamReader;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Collection;
import java.util.Iterator;
import java.util.List;

public class NewMain{

public static void main(String[] args){

    try{
        FileInputStream fstream = new FileInputStream("Filename");

        //Get the object of datainputstream
        DataInputStream in = new DataInputStream(fstream);
        BufferedReader br = new BufferedReader(new InputStreamReader(in));
        String strLine;

        List<String> listOfWords = new ArrayList<String>();
       while((strLine = br.readLine()) != null){
        String [] tokens = strLine.split("\\s+");
        String [] words = tokens;
        for(String word : words){
            listOfWords.add(word);
            System.out.print(word);
            System.out.print(" ");      
        } 
        System.out.print("\n");
    }
       System.out.println(listOfWords);

        List<String> space = new ArrayList<String>();
        String[] spaces = {" "};
        space.addAll(Arrays.asList(spaces));

        editList(listOfWords,space);

        System.out.println(listOfWords);
in.close();
    }
    catch(Exception e){
        System.err.println("Error: " + e.getMessage());    
    }  
}

public static void editList(Collection<String> list1, Collection<String> list2){
    Iterator<String> it = list1.iterator();
        while(it.hasNext()){         
       if(list2.contains(it.next())) {
                it.remove();
            }  
       }
}
} 

String[] spaces = {" "};应该删除空格,因为我已经通过从非文件数组列表中删除空格来测试它。奇怪的是,如果我将其更改为String[] spaces = {"cat"};它将从 arrayList 中删除 cat。

4

3 回答 3

3

原因很明显。一个可能的解决方案是使用这个:

strLine = br.readLine().trim()

然后将您的while循环实现为:

while (strLine != null && !strLine.isEmpty()) { //do stuff }

于 2012-12-30T11:32:08.770 回答
2

在你的 for 循环中添加一个 if 条件:

for(String word : words){
            if(!word.equals(""))  /* OR if( (word.length > 0) )*/  {
            listOfWords.add(word);
            System.out.print(word);
            System.out.print(" ");   
           }   
        } 
于 2012-12-30T11:30:06.953 回答
2

尝试删除字符串 - 因为您通过空格模式拆分,所以\s+您的列表中不会" ",但是""

String[] spaces = {""};

但是不要在之后删除它们,而是首先不要添加它们

if (word.length() == 0) continue;
listOfWords.add(word);

(并添加您需要的任何类似过滤器!)

不仅仅是简单的。它也更有效率。从数组列表中删除元素成本O(n)。因此,您用于过滤的代码的复杂性是O(n^2)(您可以O(n)通过复制到第二个列表来解决这个问题)。首先不添加元素本质上是免费的;通过这种方式,您的解析甚至会变得更快一些 - 仍然在O(n),但比第二步中的 filter 更快。

于 2012-12-30T11:32:20.350 回答