有PyICU库,我知道它可以用来音译字符串。但是没有文档。任何人都有一个简单的例子,它使用PyICU将 unicode 字符串转译为 ASCII ?
问问题
1481 次
2 回答
3
这里有一个很好的 PyICU 备忘单:https ://gist.github.com/dpk/8325992
这是一个稍作修改的示例:
>>> import icu
>>> tl = icu.Transliterator.createInstance('Any-Latin; Latin-ASCII')
>>> tl.transliterate('Ψάπφω')
'Psappho'
于 2019-07-15T20:40:34.140 回答
0
从您提供的第一个链接中,我假设 1)您已经构建了 PyICU 2)您已确保该库是可访问的(如果您没有上述内容,请参阅链接页面上的文档)
我从您的链接中找到了此文档:
要将以非 utf-8 编码的 Python str 转换为 ICU UnicodeString,请使用 UnicodeString(str, encodingName) 构造函数。
所以你需要找到encodingName,我猜你的应该是ASCII(你应该检查以确保它是正确的,我没有打扰)
然后我想你会做这样的事情:
>>> from icu import UnicodeString
.
.
.
>>> string = UnicodeString(strToConvert, ASCII)
这只是一个快速的想法,ymmv。您可能想查看该网站,因为它提供了更多示例以及如何以“Python 方式”或“ICU 方式”做事。干杯!
于 2013-01-22T13:53:50.447 回答