1

我还不太擅长阅读阿姆哈拉语(吉兹/埃塞俄比亚)字母。

如果我有 Ge'ez(埃塞俄比亚)字母(http://en.wikipedia.org/wiki/Ge%27ez_language)的文本,我想将它们音译为 ASCII。

当我使用 LYNX Textmode 浏览器访问http://www.addismap.com/am/(阿姆哈拉语网页)时,它会显示“edis map: yeedis ebeba karta”。如何在 Python、Bash 或 PHP 中访问此功能?他们使用哪个 API?

好像不是iconv:

$ iconv -f UTF-8 -t ASCII//TRANSLIT
Input:    ሀ ለ ሐ መ ሠ ረ ሰ
Output:   ? ? ? ? ? ? ?
4

2 回答 2

2

ICU http://icu-project.org/有一个阿姆哈拉语-拉丁语转换,它将把你的文本变成“hā le ḥā me še re se”。您可以uconv -x 'Amharic/BGN-Latin'从命令行使用它,也可以使用pyicu

于 2010-10-16T00:10:09.220 回答
0

Unicode Common Locale Data Repository定义了一些音译。 Unidecode(或其Python 端口)有更多。

于 2010-09-10T13:28:15.753 回答