1

我将从列表项中删除 '\n' (新行)。以下命令从 DataFrame 格式的 excel 文件中读取数据,然后将其转换为列表“bodylist”:

data = pd.read_excel (r'C:\Users\thmag\HealthUnlockSelenium\PopularPosts\out2.xlsx')
df = pd.DataFrame(data, columns= ['body'])
#print (df)

#convert df to list
bodylist = df.values.tolist()
bodylist= map(lambda s: s.strip(),bodylist)
for item in bodylist:
    
    print (item)

但我有以下错误:

 bodylist= map(lambda s: s.strip(),bodylist)

AttributeError: 'list' object has no attribute 'strip'
4

2 回答 2

1

你可以试试这个

bodylist = df.values.tolist()
bodylist = [elt.replace("\n", "") for elt in bodylist]

给定一个列表,您可以通过理解浏览它并创建一个不带 «\n» 字符的新列表。

于 2021-04-13T07:40:14.397 回答
0
df['body'] = df['body'].apply(lambda line: line.replace('\n', ''))

此代码将在数据帧本身内执行操作,apply采用函数或 lambda 操作,并将在数据帧中的每一行上执行它。

如果您之后需要列表表示,您可以将其转换为列表。

于 2021-04-13T07:45:11.887 回答