23

Python 3.4 和 Pandas 0.15.0

df 是一个数据框, col1 是一个列。使用下面的代码,我正在检查值 10 的存在并将这些值替换为 1000。

df.col1[df.col1 == 10] = 1000

这是另一个例子。这一次,我根据索引更改 col2 中的值。

df.col2[df.index == 151] = 500

这两个都会产生以下警告:

-c:1: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame

See the the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy

最后,

cols = ['col1', 'col2', 'col3']
df[cols] = df[cols].applymap(some_function)

这会产生类似的警告,并添加一个建议:

Try using .loc[row_indexer,col_indexer] = value instead

我不确定我是否理解警告中指出的讨论。编写这三行代码的更好方法是什么?

请注意,操作有效。

4

2 回答 2

39

这里的问题是:df.col1[df.col1 == 10]返回一个副本。

所以我想说:

row_index = df.col1 == 10
# then with the form .loc[row_indexer,col_indexer]
df.loc[row_index, 'col1'] = 100
于 2014-11-03T22:37:48.817 回答
5

同意保罗关于'loc'的用法。

对于您的 applymap 案例,您应该能够做到这一点:

cols = ['col1', 'col2', 'col3']
df.loc[:, cols] = df[cols].applymap(some_function)
于 2014-11-04T16:19:03.787 回答