python - 如何使用 Python 标记 csv 文件中特定列中的所有行？

Question

我正在使用 Python 进行情绪分析（我仍然是这种特定编程语言的新手）。我在 csv 文件中有一些 Twitter 数据，我需要在进行实际分析之前对其进行预处理。首先，我需要对特定列中的文本进行标记，在我的情况下是第二列或 col B。我发现了一些如何进行标记化但不选择特定列的建议。有这方面经验的人吗？

我尝试了这段代码，它似乎适用于所有列，但是如何将它隔离到第二列？

import csv
import nltk
from nltk import word_tokenize 

with open('TwitterData.csv', 'r') as csvfile:
   reader = csv.DictReader(csvfile)
   for row in reader:
       print(row)

对用于情绪分析预处理的模块和代码有什么建议吗？

非常感谢！

score 1 · Accepted Answer

我可以向您强烈推荐 scikit-learn 文档和模块，尤其是关于“使用文本数据”的部分：https ://scikit-learn.org/stable/tutorial/text_analytics/working_with_text_data.html

他们还有一个关于情绪分析的部分：https ://scikit-learn.org/stable/tutorial/text_analytics/working_with_text_data.html#exercise-2-sentiment-analysis-on-movie-reviews

如果您在代码方面需要更具体的帮助，最好提供一个“最小可重现示例”：https ://stackoverflow.com/help/minimal-reproducible-example 这样，其他人可以更好地帮助您解决特定问题你面对。

我希望这会有所帮助:)

python - 如何使用 Python 标记 csv 文件中特定列中的所有行？

1 回答 1

Related

Reference