我有一个元组列表。这些元组包含一个标签和一个列表。它看起来像这样:
[('neg', ['watching', 'by', 'myself', 'tweetdebate', 'not', ...]), ('pos', ['here', 'we', 'go', 'tweetdebate', 'tweetdebate', ...])]
它可以通过这个迭代
for label, words in labeled_words:
我怎样才能改变这些词以获得它们的小写词干?
我猜是这样的循环(词干分析器是 PorterStemmer() ):
stemmer.stem(word.lower())
这不起作用:
labeled_words = [( label, [stemmer.stem(word.lower()) for words]) for label, words in labeled_words ]
感谢您的时间。