使用 a BreakIterator.getWordInstance()
,文本"can't"
被认为是一个“单词”
一个小实验表明,虽然单词中的撇号被认为是单词的一部分。两端的撇号被认为与单词分开 - 即在撇号和字母之间报告单词边界。
即使拼写正确,这也排除了诸如"'tis"
和之类的单词被视为“单词”。"dogs'"
有没有办法纠正这种行为,或者这是一个错误?
使用 a BreakIterator.getWordInstance()
,文本"can't"
被认为是一个“单词”
一个小实验表明,虽然单词中的撇号被认为是单词的一部分。两端的撇号被认为与单词分开 - 即在撇号和字母之间报告单词边界。
即使拼写正确,这也排除了诸如"'tis"
和之类的单词被视为“单词”。"dogs'"
有没有办法纠正这种行为,或者这是一个错误?