我有一个 getNextChar() 方法,它逐个字符地读取字符串。我正在编写一种方法来获取 getNextChar() 提供的字符序列中的单词。
文本包含标点符号和其他特殊字符。
我想有一个包含所有标点符号和特殊字符的数组,当我读取文本的字符时,检查字符是否在数组中以忽略它。该方法将在获得空格时识别该单词。这些单词将存储在一个集合(例如:地图)中,因为我还需要通过检查该单词之前是否已在地图中插入并增加该单词的计数器来计算频率。
- 这是最好和最有效的方法吗?我正在寻找最有效的方法。一个
- 是否有完整的标点符号和特殊字符列表?