0

我正在尝试在我的数据集上使用 rake 来提取关键词和短语。不过,我在我的数据框上应用它时遇到了一些麻烦。

我的代码如下:

     df = pd.read_csv('_________')

     def rake_implement(x, r):
       r.extract_keywords_from_text(x)
       ranked = r.get_ranked_phrases()
       return ranked

    df['rake_output'] = df['rake_input'].apply(lambda x: rake_implement(x, r))

其输出本质上只是将每条记录中的任何文本作为一个实体返回

所以: inputrow1 = '你好,这是一些文本' ----> ['你好,这是一些文本']

如果我一次使用一段文本,它可以正常工作,例如 rake_implement('this will work well')

似乎我的问题是以某种方式从 csv 读取数据,有没有人知道一种方法来遍历 pd df 的每一行并将 rake 应用于每条记录?

4

0 回答 0