向所有在这里贡献时间和脑力的人致敬。我正在使用缅甸语文本,资源很少。
为了在 Unicode 中的 Unicode 文本列中使换行正常工作,我想编译一个正则表达式,它将在以下上下文中插入一个零宽度空格 (ZWSP) [u\200B]:
在任何 unicode 字符范围 [\u1000-\u1021] 的示例之前插入 ZWSP
除非
- 字符后跟 [\u103A]
或者
- 前一个字符是相同范围的 unicode 字符 [\u1000-\u1021] 或 [\u1039] 之一,(我可能需要稍后添加一两个其他字符)。
任何人都可以帮忙吗?我将在 UltraEdit 中使用大量文本语料库进行查找/替换。