你认为只有Regex才有可能吗?
这是我在 Go Playground 上的尝试
使用一些脏代码可以成功
http://play.golang.org/p/YysZCB3vlu
我希望将扩展的韩语字符转换为完整的字母。例如,“ㅈㅗㅎㅡㄱㅂㅅㅣㅏㅏㅛㅏㅏㅊㅣㅣㅁㅁㅇㅏㅏㄴㄴㄴㅕㅕㅕㅇㅇㅎㅏㅅㅅㅔㅔㅔㅇㅇㅇㅇ”
对于不能正确呈现韩文字符的浏览器:
좋 은값 进 싸 요 아 침 안 녕 하 세 요 웬</p>
简单的部分是韩文字母只能以一个辅音+一或两个元音开头。这可以用 ( .([ㅏ-ㅣ])+
) 捕获。
具有挑战性的部分是元音后面的零个或一个或最多两个可选辅音。很难的另一个原因是,在最多两个可选辅音之后,我们还有另一个不属于前一个字母的辅音,这个辅音意味着另一个新字母的开始。
如下所示:
ㄱㅏㅂㅅㅇㅣ
= ㄱㅏㅂㅅ + ㅇㅣ
= 값 + 이
= 값이
可以使用 if 条件和基本正则表达式捕获所有模式。但如果我有更短的版本会很好。
我的最终目标是转换“ㅈㅗㅎㅡㄱ”ㅅㅣㅆㅇㅛㅇㅏㅏㅊㅣㅁㅇㅏㅏㄴㄴㄴㄴㅕㅇㅎㅏㅏㅅㅅㅅㅅㅅㅅㅛㅇㅔㄴㅔㄴㅔㄴㅇㅇㅔㄴㅇㅇㅇㅇㅇㅇ
对于不能正确呈现韩文字符的浏览器:
좋 은값 进 싸 요 아 침 안 녕 하 세 요 웬</p>