1

我在 python 中使用 pyenchant 进行拼写检查。我的代码适用于英语,但现在我想让它也适用于其他语言。为此,首先我需要确认特定单词是否属于所选语言。例如,tree可能是英文单词,也可能不是英文单词,即这个单词中的所有字符都属于,english所以它可能是一个有效的英文单词。我可以使用python的isalpha函数来检查它与英语的归属。

isalpha将返回 falsetree's因为'不是英文字符。

在这种情况下,我会将单词从任何不在英语词典中的字符中拆分出来。为此,我使用以下代码:

import enchant

d = enchant.request_dict("en_US")
word = "tree's"
for a in word:
    print a

我将再次isalpha对每个字符使用函数并在函数返回 false 时拆分。

不幸的是,我没有得到任何类似于isalpha其他语言的功能。其次,如果我将上述代码用于其他语言,那么它会在输出中打印奇数值。例如,如果我想为hindi语言运行它,

# coding: utf-8
import enchant

d = enchant.request_dict("hi_IN")
word = "अभिमन्यु"
for a in word:
    print a

此代码的输出?在每一行中打印。

我有两个问题要问

1)阅读英语以外的语言字符的正确方法是什么?

isalpha2)除了英语之外,还有其他语言的替代功能吗?

4

0 回答 0