0

我有一个数据框,它由一个带有标签的列组成

tags
------------
['tag1' 'tag2']
['tag1']
['tag5' 'tag3' 'tag6']

如何获取以下格式的数据框?

    tags
    ------------
    ['tag1','tag2']
    ['tag1']
    ['tag5','tag3','tag6']

查看单行时:

print(df['tags'][0][0])
>>> "'tag1' 'tag2'"
print(df['tags'][0][0][0]
>>> "'"

我尝试了以下方法:

def Convert(string): 
    li = list(string.split(" ")) 
    return li 
str1 = Convert(df1['tags'][0][0])
print(str1)
>>> ["'tag1'", "'tag2'"]

Method2这对我也不起作用。

import ast
ast.literal_eval(df['tags'][0][0])
>>>'tag1tag2' 

Question2我想计算标签的总出现次数,df['tags'].value_counts()但不起作用。它要么将整个列表作为计数它们的出现,要么如果我修改列表,那么它将采用字符计数。

4

1 回答 1

1

这是你想要的?

list1 = ["'tag1' 'tag2'"]
result = [w.strip("'") for w in list1[0].split(' ')]
print(f'converted\n{list1}\nto\n{result}')
于 2021-02-28T09:16:47.213 回答