我正在尝试在我的数据集上使用 rake 来提取关键词和短语。不过,我在我的数据框上应用它时遇到了一些麻烦。
我的代码如下:
df = pd.read_csv('_________')
def rake_implement(x, r):
r.extract_keywords_from_text(x)
ranked = r.get_ranked_phrases()
return ranked
df['rake_output'] = df['rake_input'].apply(lambda x: rake_implement(x, r))
其输出本质上只是将每条记录中的任何文本作为一个实体返回
所以: inputrow1 = '你好,这是一些文本' ----> ['你好,这是一些文本']
如果我一次使用一段文本,它可以正常工作,例如 rake_implement('this will work well')
似乎我的问题是以某种方式从 csv 读取数据,有没有人知道一种方法来遍历 pd df 的每一行并将 rake 应用于每条记录?