我想在数据预处理步骤中使用 pipspellcheck 来检查拼写错误的单词。我使用了自动更正包,但是,我无法更改它的字典来添加更多单词。
如何使用 pipspellcheck 来检查和替换句子级别的错误单词?或者如何更改自动更正的字典?
from spellchecker import SpellChecker
spell = SpellChecker()
misspelled = spell.unknown(['something', 'is', 'hapenning', 'here'])
for word in misspelled:
print(spell.correction(word))
print(spell.candidates(word))
from autocorrect import spell
def autospell(text):
spells = [spell(w) for w in (nltk.word_tokenize(text))]
return " ".join(spells)
def main():
text = "skyrim"
spell_text = autospell(text)
print (spell_text)