1

PyICU库,我知道它可以用来音译字符串。但是没有文档。任何人都有一个简单的例子,它使用PyICU将 unicode 字符串转译为 ASCII ?

用于音译的 C++ ICU文档在此处,但我不明白如何从 Python 中调用它。

4

2 回答 2

3

这里有一个很好的 PyICU 备忘单:https ://gist.github.com/dpk/8325992

这是一个稍作修改的示例:

>>> import icu
>>> tl = icu.Transliterator.createInstance('Any-Latin; Latin-ASCII')
>>> tl.transliterate('Ψάπφω')
'Psappho'
于 2019-07-15T20:40:34.140 回答
0

从您提供的第一个链接中,我假设 1)您已经构建了 PyICU 2)您已确保该库是可访问的(如果您没有上述内容,请参阅链接页面上的文档)

我从您的链接中找到了此文档:

要将以非 utf-8 编码的 Python str 转换为 ICU UnicodeString,请使用 UnicodeString(str, encodingName) 构造函数。

所以你需要找到encodingName,我猜你的应该是ASCII(你应该检查以确保它是正确的,我没有打扰)

然后我想你会做这样的事情:

>>> from icu import UnicodeString
 . 
 .
 . 
>>> string = UnicodeString(strToConvert, ASCII)

这只是一个快速的想法,ymmv。您可能想查看该网站,因为它提供了更多示例以及如何以“Python 方式”或“ICU 方式”做事。干杯!

于 2013-01-22T13:53:50.447 回答