2

我有以下数据框:

# List of Tuples
matrix = [([22, 23], [34, 35, 65], [23, 29, 31]),
         ([33, 34], [31, 44], [11, 16, 18]),
         ([44, 56, 76], [16, 34, 76], [21, 34]),
         ([55, 34], [32, 35, 38], [22, 24, 26]),
         ([66, 65, 67], [33, 38, 39], [27, 32, 34]),
         ([77, 39, 45], [35, 36, 38], [11, 21, 34])]

# Create a DataFrame object
df = pd.DataFrame(matrix, columns=list('xyz'), index=list('abcdef'))

在此处输入图像描述

我可以应用我的自定义函数来输出列表中的开始、结束项目,如下所示:

def fl(x):
    return [x[0], x[len(x)-1]]

df.apply(lambda x : [fl(i) for i in x])

在此处输入图像描述

但我想将该函数应用于选定的列 x 和 z。

我正在尝试如下参考此链接

df.apply(lambda x: fl(x) if x in ['x', 'y'] else x)

像这样:

df[['x', 'y']].apply(fl)

如何使用仅应用于 x 和 z 列且 y 列未更改的函数来获取输出。

4

2 回答 2

1

用于DataFrame.applymap元素处理,最后一个值也可以使用[-1]索引:

def fl(x):
    return [x[0], x[-1]]

df[['x', 'z']] = df[['x', 'z']].applymap(fl) 
print (df)
          x             y         z
a  [22, 23]  [34, 35, 65]  [23, 31]
b  [33, 34]      [31, 44]  [11, 18]
c  [44, 76]  [16, 34, 76]  [21, 34]
d  [55, 34]  [32, 35, 38]  [22, 26]
e  [66, 67]  [33, 38, 39]  [27, 34]
f  [77, 45]  [35, 36, 38]  [11, 34]

或者用于DataFrame.applyzip元组映射到lists 并通过以下方式进行选择的解决方案str

def fl(x):
    return list(map(list, zip(x.str[0], x.str[-1])))

df[['x', 'z']] = df[['x', 'z']].apply(fl) 
print (df)
          x             y         z
a  [22, 23]  [34, 35, 65]  [23, 31]
b  [33, 34]      [31, 44]  [11, 18]
c  [44, 76]  [16, 34, 76]  [21, 34]
d  [55, 34]  [32, 35, 38]  [22, 26]
e  [66, 67]  [33, 38, 39]  [27, 34]
f  [77, 45]  [35, 36, 38]  [11, 34]
于 2019-11-28T06:21:45.520 回答
0

发现我正在做的错误。

谢谢回复。

我更改了如下功能:

def fl(x):
    new = []
    for i in x:
        new.append([i[0], i[-1]])
    return new

然后像这样应用功能。

df.apply(lambda x : fl(x) if x.name in ['x', 'z'] else x)

然后我就能得到预期的输出。

于 2019-11-28T06:50:11.470 回答