我在 python 中使用 pyenchant 进行拼写检查。我的代码适用于英语,但现在我想让它也适用于其他语言。为此,首先我需要确认特定单词是否属于所选语言。例如,tree
可能是英文单词,也可能不是英文单词,即这个单词中的所有字符都属于,english
所以它可能是一个有效的英文单词。我可以使用python的isalpha
函数来检查它与英语的归属。
isalpha
将返回 falsetree's
因为'
不是英文字符。
在这种情况下,我会将单词从任何不在英语词典中的字符中拆分出来。为此,我使用以下代码:
import enchant
d = enchant.request_dict("en_US")
word = "tree's"
for a in word:
print a
我将再次isalpha
对每个字符使用函数并在函数返回 false 时拆分。
不幸的是,我没有得到任何类似于isalpha
其他语言的功能。其次,如果我将上述代码用于其他语言,那么它会在输出中打印奇数值。例如,如果我想为hindi
语言运行它,
# coding: utf-8
import enchant
d = enchant.request_dict("hi_IN")
word = "अभिमन्यु"
for a in word:
print a
此代码的输出?
在每一行中打印。
我有两个问题要问
1)阅读英语以外的语言字符的正确方法是什么?
isalpha
2)除了英语之外,还有其他语言的替代功能吗?