问题标签 [pandas-loc]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
505 浏览

python - 更改列值 Pandas Python LOC ILOC SETVALUE 难度

我在相当大的代码中遇到了一个奇怪的问题。通常,我使用 .loc 在循环中更改特定列中的特定项目,同时使用 row_index 变量作为帮助。让我们假设有以下内容:

循环中的打印命令(对于前 6 次迭代)给了我类似的东西:

senti_pos_valueoutput_rowindex_list都是整数值。对于循环中的每次迭代,后者都严格增加一。

senti_pos_value本身会根据一些更复杂的操作(约 400 行代码)任意更改。但是,最终结果始终是整数。

所以我想将所有 senti_pos_values - 逐行 - 在同一列中。到目前为止,我对此类问题没有任何问题,但最终结果证明代码不起作用。它根本不写任何东西,Column1 的数字保持为零(参见下文)。

我也尝试了以下方法:

和:

也没有成功...对于我收到的两个,即循环中的一个特定大纲: output_rowindex_list = 113 和 senti_pos_value = 4

如上所述:df.iloc[output_rowindex_list,df.columns.get_loc('Column1')]=senti_pos_value

设置断点并手动输入相关代码行时不会返回任何错误,但不幸的是,我的列的最终数据帧看起来像这样(引用与打印命令显示的相同输入):

另外,请注意,无论我在根本没有设置断点的情况下使用哪个命令,代码始终可以正常工作而不会中断。在这种情况下,结果始终如上文第 1 列所述。

我对熊猫并不陌生,但我花了几个小时才弄清楚,我根本看不出原因......任何帮助都非常感谢!

0 投票
3 回答
35806 浏览

python - Python:熊猫系列 - 为什么使用 loc?

为什么我们对 pandas 数据框使用“loc”?似乎以下代码无论是否使用 loc 都编译 anr 以类似的速度运行

或者

那么为什么要使用 loc 呢?

编辑:这已被标记为重复问题。但是虽然pandas iloc vs ix vs loc 的解释?确实提到*

您只需使用数据框的 getitem即可进行列检索:

*

它没有说明我们为什么使用 loc,尽管它确实解释了 loc 的许多特性,但我的具体问题是“为什么不完全省略 loc”?我已经接受了下面一个非常详细的答案。

此外,其他帖子的答案(我认为不是答案)在讨论中非常隐藏,任何搜索我正在寻找的东西的人都会发现很难找到信息,并且提供的答案会更好地服务我的问题。

0 投票
1 回答
2371 浏览

python - How to change specific cell values in a pandas dataframe column series based on multiple conditions?

I am trying to replace all values in a pandas dataframe column df.column_A if they fall within the range of 1 to 10.

However, when I do:

Produces:

Alternatively, when I do:

I am not getting an error at all, but the values don't get replaced.

What is strange is that when I do:

all values in df.column_A get replaced with 1, as I would expect.

This means that the syntax of the line is correct, so the mistake must be due to some factors I don't understand.

What am I doing wrong?

0 投票
1 回答
2257 浏览

python - 如何将字符串添加到熊猫数据框列系列中的每个偶数行?

我是熊猫新手。

我想向熊猫数据框添加一个新列,df并将“开始”分配给每个奇数行,将“停止”分配给每个偶数行。

但是,当我这样做时df.iloc[1::2, :] = "Start",我会在每个第二个位置插入一个新行,每列中都有“开始”字符串。

我知道在这种情况下,熊猫不知道将“开始”字符串放在哪一列。

但是,我无法弄清楚正确的语法。

0 投票
1 回答
3397 浏览

python - Pandas loc() method with boolean array on axis 1

I am experimenting with the Pandas loc() method, used with boolean arrays as arguments.

I created a small dataframe to play with:

And a boolean array to use on axis 1 to subset a number of columns:

I then tried:

I got an error message:

IndexingError: Unalignable boolean Series key provided

How can I apply the boolean array to subset a number of columns with loc()?

0 投票
1 回答
5178 浏览

python - Python pandas DataFrame loc 选择一系列行和列

这是我的 DataFrame df 的 head():

我想选择 2010 年 8 月 1 日至 8 月 15 日,只显示温度列。

我想做的是: df.loc[['2010-08-01','2010-08-15'],'Temperature']

但这给我一个错误。

一般来说,我想学习的是如何使用 loc 方法轻松地将 i 行到 k 行和 j 列到 p 的范围内,并使用 loc 方法在数据框中显示它:

df.loc[[i:k],[j:p]]

非常感谢您提前!!!史蒂夫

0 投票
1 回答
21235 浏览

python - 在 Pandas 中用 .loc 覆盖 Nan 值

我尝试使用以下代码行解决所需的任务:

df['Age'][np.isnan(df["Age"])] = rand1

在此处输入图像描述

但这会引发“SettingWithCopyWarning”,我认为通过使用该.loc功能在数据帧(列“年龄”)中定位 Nan 值可能是一种更好的方法。

我已经查看了文档,但仍然不知道如何解决这个问题。在这里也找不到任何解决方案.loc

我将不胜感激任何提示和建议。

0 投票
1 回答
535 浏览

python - .loc 与 pandas 一次相同的列

这可能是一个相当无用的问题,但我想学习如何 .loc 为同一列同时按行切片。让我们想象一下我有这个df:

我怎么能只用 1 个句子更新第 4 列,还是不可能?提前致谢。

0 投票
1 回答
1274 浏览

python - 在 pandas 中加入数据框的最有效方法:loc 还是 join?

假设我有两个数据框;一个保存交易,trans另一个保存产品信息,prod我想将产品价格、变量price加入到交易数据框中,并为每一列重复它们。以下哪种方法更有效/更受欢迎:

方法一:

方法二:

0 投票
3 回答
2943 浏览

python - 熊猫将年龄变量分组

我有一个带有年龄的数据框 df,我正在将文件分类为 0 和 1 的年龄组。

东风:

我尝试了以下

但得到这个错误

为避免它,我将使用 .loc

但是,这将所有年龄标记为 1

这就是我得到的

虽然这是目标

谢谢