Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
最近我想到是否可以使用 C# 识别希伯来语单词的标点符号。希伯来语中有一些标点符号,例如:
יוּעָדוּ
当然,通常我们不会标点单词,所以它应该看起来像:
יועדו
有没有办法使用 C# 来识别诸如此类的单词的标点符号?
在 Python 中,序列解析如下:
>>> a = unicode('יוּעָדוּ', 'utf-8') >>> b = unicode('יועדו', 'utf-8') >>> a u'\u05d9\u05d5\u05bc\u05e2\u05b8\u05d3\u05d5\u05bc' >>> b u'\u05d9\u05d5 \u05e2 \u05d3\u05d5'
(我添加了空格以使事情更清晰。)
您可以清楚地看到标点符号。寻找这些的 AC# 正则表达式可能是您想要的方向。