我在标记熊猫系列中的单词时遇到问题。
我的系列名为df
:
text
0 This monitor is a great deal for the price.
1 I would recommend it.
2 poor packaging.
dtype: object
我试过df_tokenized=nltk.word_tokenize(df)
但结果TypeError: expected string or bytes-like object
我还尝试了 3 种变体.apply(lambda row:)
df_tokenized=df.apply(lambda row: nltk.word_tokenize(row['text']), axis=1)
> TypeError: <lambda>() got an unexpected keyword argument 'axis'
df_tokenized=df.apply(lambda row: nltk.word_tokenize(row['text']))
> TypeError: string indices must be integers
df_tokenized=df.apply(lambda row: nltk.word_tokenize(row[1]))
> TypeError: 'float' object is not subscriptable
还有其他方法可以标记系列中的单词吗?