0

最近我想到是否可以使用 C# 识别希伯来语单词的标点符号。希伯来语中有一些标点符号,例如:

יוּעָדוּ

当然,通常我们不会标点单词,所以它应该看起来像:

יועדו

有没有办法使用 C# 来识别诸如此类的单词的标点符号?

4

1 回答 1

1

在 Python 中,序列解析如下:

>>> a = unicode('יוּעָדוּ', 'utf-8')
>>> b = unicode('יועדו', 'utf-8')
>>> a
u'\u05d9\u05d5\u05bc\u05e2\u05b8\u05d3\u05d5\u05bc'
>>> b
u'\u05d9\u05d5      \u05e2      \u05d3\u05d5'

(我添加了空格以使事情更清晰。)

您可以清楚地看到标点符号。寻找这些的 AC# 正则表达式可能是您想要的方向。

于 2012-12-07T05:55:24.733 回答