我想我有一个相对简单的问题,但无法找到合适的答案来解决编码问题。
我有一个字符串的熊猫列:
df1['tweet'].head(1)
0 besides food,
Name: tweet
我需要提取文本并将其推送到 Python str 对象中,格式如下:
test_messages = ["line1",
"line2",
"etc"]
目标是对一组测试推文进行分类,因此相信输入:X_test = tfidf.transform(test_messages)
是一个 str 对象。