我有一个 CSV 文件,其中的行如下所示:
ID,98.4,100M,55M,65M,75M,100M,75M,65M,100M,98M,100M,100M,92M,0#,0N#,
我可以用
#!/usr/bin/env python
import pandas as pd
import sys
filename = sys.argv[1]
df = pd.read_csv(filename)
给定一个特定的列,我想按 ID 拆分行,然后输出每个 ID 的平均值和标准差。
我的第一个问题是,如何从数字中删除所有非数字部分,例如“100M”和“0N#”,它们应该分别为 100 和 0。
我还尝试遍历相关标题并使用
df[header].replace(regex=True,inplace=True,to_replace=r'\D',value=r'')
正如Pandas DataFrame 中所建议的:从列中的字符串中删除不需要的部分。
但是,这会将 98.4 更改为 984。