有谁知道 Scanner 的 .next() 方法如何处理标点符号?我在任何地方都找不到这个问题的答案。我有一个程序从文本文件中读取每个单词,但我不确定它如何处理“那是”或“它们是”或“她”等部分。
对于句点和逗号,它们是否被视为一个单独的实体,或者如果它像“她”一样出现,它们是否被视为单词的一部分。还是她,”?根据它的作用,是“她”和“她”。还是“她”和“她”被扫描仪视为两个不同的词?
对于撇号,它们是否被考虑在内,或者它们是否有效地将单词一分为二?例如,“他们是”会被识别为“他们”“'”“re”还是完全被识别为“他们是”?
我希望我清楚地了解了这个问题。