我有一些 UTF Cyrillic 文本需要插入到 RTF 文件中。RTF 文件倾向于将西里尔文文本存储为转义序列,使用 \'00 或 \u0000。
由于文本在.NET 中,我猜它是UTF-16。作为一个具体的例子,我有这个文本"4 окт 2013"
。OKT 是西里尔文文本。
以 ® 为例,Unicode 十进制是 1086,UTF-8 十进制是 208 190。
我想做的是有一个正则表达式(在.NET中)来识别这样的字符,这些字符需要转换为 RTF 转义序列,因为它们可以被本地识别。
.NET 中有哪些正则表达式选项可以帮助识别这样的字符?