0

我需要阅读器的帮助,它将删除标点符号和数字,并从输入中创建字符串数组。

例如,在输入中,将有一个“example.txt”文件,其中包含如下内容:

Hello 123 , I'am new example ... text file!"

我需要我的读者创建包含以下内容的数组:

String[] example = {"Hello", "I", "am", "new", "example", "text", "file"}

有没有办法删除标点符号和数字并使用缓冲阅读器创建字符串数组?

提前谢谢你,菲普库斯。

4

3 回答 3

1

另一种方法是使用 StringTokenizer。它的限制性更强,但我更喜欢它,因为您只列出分隔符而不是正则表达式,这更容易阅读。

String test = "Hello 123 , I'am new example ... text file!";
ArrayList<String> exampleTemp = new ArrayList<>();
String[] example = new String[6];

StringTokenizer st = new StringTokenizer(test, " ,.1234567890!");
while(st.hasMoreTokens()) 
{
    exampleTemp.add(st.nextToken());
} 
exampleTemp.toArray(example);

for(String word : example)
{
    System.out.println(word);
}

编辑:我修改它来填充一个字符串数组。不确定空白问题。

于 2014-11-20T18:02:32.470 回答
0

使用String.split(regex). 在String regex中,您将必须删除的字符放入String regex = ",0123456789\\.".

于 2014-11-20T17:44:12.053 回答
0

最后,我这样修复它:

char[] alphabet= {'a','á','b','c','č','d','ď','e','é','ě','f','g','h',
            'i','í','j','k','l','m','n','ň','o','ó','p','q','r','ř','s','š','t','ť',
            'u','ú','ů','v','w','x','y','ý','z','ž','A','Á','B','C','Č','D','Ď','E','É',
            'Ě','F','G','H','I','Í','J','K','L','M','N','Ň','O','Ó','P','Q','R','Ř','S','Š','T',
            'Ť','U','Ú','Ů','V','W','X','Y','Ý','Z','Ž',' '};



                String vlozena = userInputScanner.nextLine();
                String fileContentsSingle = "";
                Integer lenght = vlozena.length();
                int j ;
                char cha;

                        /*
                         * kontroluje, zda se jedná o mezeru či písmeno české abecedy
                         * a poté jej přidá, pokud vyhovuje, do věty
                         */
                for (j = 0; j<lenght;j++) {
                    cha = vlozena.charAt(j);
                    for (char z : abeceda) {
                        if (cha == z) {
                            fileContentsSingle = fileContentsSingle + cha;
                        }
                    }
                }

                fileContentsSingle = fileContentsSingle.replaceAll("\\s+", " ");
                fileContentsSingle = fileContentsSingle.toLowerCase();
                String[] vetaNaArraySingle = fileContentsSingle.split("\\s+",-1);
于 2014-11-21T07:01:49.447 回答