我必须使用 Java 计算文本文档中唯一单词的数量。首先,我必须去掉所有单词中的标点符号。我使用Scanner
该类扫描文档中的每个单词并输入一个 String ArrayList
。
所以,下一步就是我遇到问题的地方!如何创建一个可以计算数组中唯一字符串数量的方法?
例如,如果数组包含apple、bob、apple、jim、bob;此数组中唯一值的数量为 3。
public countWords() {
try {
Scanner scan = new Scanner(in);
while (scan.hasNext()) {
String words = scan.next();
if (words.contains(".")) {
words.replace(".", "");
}
if (words.contains("!")) {
words.replace("!", "");
}
if (words.contains(":")) {
words.replace(":", "");
}
if (words.contains(",")) {
words.replace(",", "");
}
if (words.contains("'")) {
words.replace("?", "");
}
if (words.contains("-")) {
words.replace("-", "");
}
if (words.contains("‘")) {
words.replace("‘", "");
}
wordStore.add(words.toLowerCase());
}
} catch (FileNotFoundException e) {
System.out.println("File Not Found");
}
System.out.println("The total number of words is: " + wordStore.size());
}