我有一个数据框,它由一个带有标签的列组成
tags
------------
['tag1' 'tag2']
['tag1']
['tag5' 'tag3' 'tag6']
如何获取以下格式的数据框?
tags
------------
['tag1','tag2']
['tag1']
['tag5','tag3','tag6']
查看单行时:
print(df['tags'][0][0])
>>> "'tag1' 'tag2'"
print(df['tags'][0][0][0]
>>> "'"
我尝试了以下方法:
def Convert(string):
li = list(string.split(" "))
return li
str1 = Convert(df1['tags'][0][0])
print(str1)
>>> ["'tag1'", "'tag2'"]
Method2这对我也不起作用。
import ast
ast.literal_eval(df['tags'][0][0])
>>>'tag1tag2'
Question2我想计算标签的总出现次数,df['tags'].value_counts()
但不起作用。它要么将整个列表作为计数它们的出现,要么如果我修改列表,那么它将采用字符计数。