Unicode 有字符类别。有些是字母数字。有些是标点符号。
如果我想知道一个词是否属于关键字呢?
例如,
A,a,b,c 倾向于属于单词。Ƈ,Ǝ,ǟ也是如此,所有汉字也是如此。
像这样的句子
Hello World, I "like" (to) eat ƇƎǟ and 款开源 ©
有关键字:
Hello
World
I
like
to
eat
ƇƎǟ
款
开
源
这里, , (),© 不是单词字符,因此应该被忽略和使用。
© 也不算标点符号。'©'.IsPunctuation 在 vb.net 中返回 false,但我也想摆脱它。
现在我想制作一个可以将句子拆分为关键字的程序。为此,我需要知道哪些字符是单词字符,哪些不是。
是否有 vb.net 功能?