0

我有一些缅甸文本,这些文本被拆分为单个字符,以检查和删除相关 Unicode 块之外的字符,例如从缅甸文本中删除拉丁字符。结果(如果我使用正确的术语)是字素簇已被分开,如下所示:

ေမာင္ေကာင္းၫိႈ႕မွဴးႏိုင္

我相信虚线圆圈的位置应该是两个字符作为一个 Unicode 字符而不是两个。

正确渲染的缅甸语不应该有这些虚线圆圈,例如:

ယနေ့ မြန်မာမှုအဖြစ် ပုံဖော်ပေးခဲ့သည့် ယဉ်ကျေးမှုမှာ နှစ်ပေါင်း အတော်အတန်ကြာမြင့်နေပြီဖြစ်ကြောင်း

关于如何解决这个问题的任何想法?

4

0 回答 0