python - 在 Pandas DataFrame Python 中添加新列

Question

例如，我在 Pandas 中有数据框：

Col1 Col2
A     1 
B     2
C     3

现在，如果我想再添加一个名为 Col3 的列，并且该值基于 Col2。在公式中，如果 Col2 > 1，则 Col3 为 0，否则为 1。因此，在上面的示例中。输出将是：

Col1 Col2 Col3
A    1    1
B    2    0
C    3    0

关于如何实现这一目标的任何想法？

score 74 · Accepted Answer

你只是做一个相反的比较。if Col2 <= 1. 这将返回一个布尔系列，其False值为大于 1True的值和另一个值。如果将其转换为int64dtype，True则变为1，False变为0，

df['Col3'] = (df['Col2'] <= 1).astype(int)

如果您想要一个更通用的解决方案，您可以Col3根据您的值分配任何数字，Col2您应该执行以下操作：

df['Col3'] = df['Col2'].map(lambda x: 42 if x > 1 else 55)

或者：

df['Col3'] = 0
condition = df['Col2'] > 1
df.loc[condition, 'Col3'] = 42
df.loc[~condition, 'Col3'] = 55

score 0 · Accepted Answer

我发现向 DataFrame 添加列的最简单方法是使用“add”函数。这是一段代码，也输出到 CSV 文件。请注意，包含“columns”参数允许您设置列的名称（恰好与我用作数据源的 np.array 的名称相同）。

#  now to create a PANDAS data frame
df = pd.DataFrame(data = FF_maxRSSBasal, columns=['FF_maxRSSBasal'])
# from here on, we use the trick of creating a new dataframe and then "add"ing it
df2 = pd.DataFrame(data = FF_maxRSSPrism, columns=['FF_maxRSSPrism'])
df = df.add( df2, fill_value=0 )
df2 = pd.DataFrame(data = FF_maxRSSPyramidal, columns=['FF_maxRSSPyramidal'])
df = df.add( df2, fill_value=0 )
df2 = pd.DataFrame(data = deltaFF_strainE22, columns=['deltaFF_strainE22'])
df = df.add( df2, fill_value=0 )
df2 = pd.DataFrame(data = scaled, columns=['scaled'])
df = df.add( df2, fill_value=0 )
df2 = pd.DataFrame(data = deltaFF_orientation, columns=['deltaFF_orientation'])
df = df.add( df2, fill_value=0 )
#print(df)
df.to_csv('FF_data_frame.csv')

python - 在 Pandas DataFrame Python 中添加新列

2 回答 2

Related

Reference