我试图将字符串解析为仅字母,因此所有标点符号、数字、符号等都被视为分隔符。这是我的问题:有很多非字母字符要分隔。
有没有办法过滤所有这些字符?我的意思是有 26 个标准英文字母,如果算上大写字母,则有 52 个。我知道 ASCII/Unicode 并不能真正以这种方式工作,但似乎应该有某种排他性方法,因为我可以提供我想要允许的所有字符并在 ASCII/Unicode 表中建立其他所有内容一个分隔符。
所以我想我在问,这样的事情可能吗?您可以隔离 65-90 和 97-122 (Unicode) 范围之外的所有内容吗?
我目前正在使用它作为我的分隔符字符串,虽然它可能捕获了 95% 需要捕获的字符,但我想要更实质性的东西:
#define DELIMITERS " 0123456789<>?:,./;'[]{}-=_+\\\""