我在使用 .text 文件消除和标记化 .text 文件时遇到了困难nltk
。我不断收到以下内容AttributeError: 'list' object has no attribute 'lower'
。
我只是不知道我做错了什么,尽管这是我第一次做这样的事情。以下是我的代码行。我将不胜感激任何建议,谢谢
import nltk
from nltk.corpus import stopwords
s = open("C:\zircon\sinbo1.txt").read()
tokens = nltk.word_tokenize(s)
def cleanupDoc(s):
stopset = set(stopwords.words('english'))
tokens = nltk.word_tokenize(s)
cleanup = [token.lower()for token in tokens.lower() not in stopset and len(token)>2]
return cleanup
cleanupDoc(s)