我正在使用 Python 进行情绪分析(我仍然是这种特定编程语言的新手)。我在 csv 文件中有一些 Twitter 数据,我需要在进行实际分析之前对其进行预处理。首先,我需要对特定列中的文本进行标记,在我的情况下是第二列或 col B。我发现了一些如何进行标记化但不选择特定列的建议。有这方面经验的人吗?
我尝试了这段代码,它似乎适用于所有列,但是如何将它隔离到第二列?
import csv
import nltk
from nltk import word_tokenize
with open('TwitterData.csv', 'r') as csvfile:
reader = csv.DictReader(csvfile)
for row in reader:
print(row)
对用于情绪分析预处理的模块和代码有什么建议吗?
非常感谢!