2

我想我有一个相对简单的问题,但无法找到合适的答案来解决编码问题。

我有一个字符串的熊猫列: df1['tweet'].head(1) 0 besides food, Name: tweet

我需要提取文本并将其推送到 Python str 对象中,格式如下:

test_messages = ["line1", "line2", "etc"]

目标是对一组测试推文进行分类,因此相信输入:X_test = tfidf.transform(test_messages)是一个 str 对象。

4

2 回答 2

2

使用list将系列(列)转换为 python 列表:

list(df1["tweet"])
于 2013-06-15T16:39:40.520 回答
0
  1. 获取 Series head(),然后访问第一个值:

    df1['tweet'].head(1).item()

  2. 或:使用 Seriestolist()方法,然后对第 0 个元素进行切片:

    df.height.tolist() [94, 170] df.height.tolist()[0] 94

(注意 Python 索引是从 0 开始的,但是head()是从 1 开始的)

于 2018-09-03T05:50:59.750 回答