0

我最近正在使用 python 在 nlp 中做项目。我需要预处理一个包含具有许多行和列的文本的 csv 文件。我只能干简单的句子。并且无法一次阻止整个 csv 文件。我怎样才能做到这一点?

4

1 回答 1

0

您可能必须阅读整个 CSV 文件并提取每个单元格。Pythoncsv将允许您读取 CSV 文件。您可能想要使用csv.reader()or csv.DictReader()。第一个将允许您遍历 CSV 的行并单独读取它们;第二个会自动将 CSV 中的数据放入 Python字典中。对于您的任务来说,这两者都是一个不错的选择。

阅读 CSV 文件后,您需要对已阅读的单词进行词干处理。如果尚未安装,您可能需要使用nltk库。是一个关于词干的资源nltk

于 2016-03-15T02:52:32.357 回答