3

我正在研究 python 中的阿拉伯语光词干分析器包
我想将任何操作的结果从 Unicode 转换为阿拉伯字母。

我的代码:

import tashaphyne
form tashaphyne  import *
>>> text = u"الْعَرَبِيّةُ"
>>> strip_tashkeel(text)

我希望它显示“العربية”而不是 Unicode

4

2 回答 2

1

您可以使用 encode() 函数将 unicode 字符串转换为任何其他编码,如下所示:

text.encode('utf8')

是 Python 2.7 中可能的编码列表。

于 2013-02-12T20:19:38.233 回答
0

您看到u'\u0627\u0644\u0639\u0631\u0628\u064a\u0629'的不是“العربية”,因为repr()unicode 字符串的表示意味着即使在 7 位终端上也可以显示。

要查看实际脚本而不是 unicode,请print _在调用 之后执行strip_tashkeel(),或print strip_tashkeel(text)直接执行。

于 2013-02-12T20:35:30.357 回答