我有一列只有文字。我需要使用 TFIDF 从每一行中提取顶级关键字。
示例输入:
df['Text']
'I live in India',
'My favourite colour is Red',
'I Love Programming'
预期输出:
df[Text] df[Keywords]
'I live in India' 'live','India'
'My favourite colour is Red' 'favourite','colour','red'
'I Love Programming' 'love','programming'
我怎么得到这个?我尝试编写以下代码
tfidf = TfidfVectorizer(max_features=300, ngram_range = (2,2))
Y = df['Text'].apply(lambda x: tfidf.fit_transform(x))
我收到以下错误 Iterable over raw text documents expected, string object received。