我最近正在使用 python 在 nlp 中做项目。我需要预处理一个包含具有许多行和列的文本的 csv 文件。我只能干简单的句子。并且无法一次阻止整个 csv 文件。我怎样才能做到这一点?
问问题
508 次
1 回答
0
您可能必须阅读整个 CSV 文件并提取每个单元格。Pythoncsv
库将允许您读取 CSV 文件。您可能想要使用csv.reader()
or csv.DictReader()
。第一个将允许您遍历 CSV 的行并单独读取它们;第二个会自动将 CSV 中的数据放入 Python字典中。对于您的任务来说,这两者都是一个不错的选择。
阅读 CSV 文件后,您需要对已阅读的单词进行词干处理。如果尚未安装,您可能需要使用nltk
库。这是一个关于词干的资源nltk
。
于 2016-03-15T02:52:32.357 回答