问题标签 [pandas-loc]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
47 浏览

python - 在日期范围内与函数交互

如果我有这样的日期框架:N

我想检查高于 0 的值,并在它们较低时将它们更改为零。

不知道我应该如何使用函数 iterrows() 和 loc() 函数来做到这一点。

0 投票
1 回答
66 浏览

python - 如何在多个条件下在python中创建一个新列?

我想在以下条件下创建一个新列:

所以基本上我有两列Majoy carMajor housetype. 我会让所有的'nocar'内部Majoy car'Rented'内部Major housetype合并到一个新列。

我的数据框是imd_car_house

我试过了:imd_car_house.loc[(cond1) | (cond2), :]但这不起作用。

0 投票
1 回答
4418 浏览

python - 使用 loc 删除索引过滤的数据帧

考虑数据框

我想过滤loc(结果将是单行)然后从某个单元格中提取一些数据

问题是索引总是进入路径。我将如何摆脱它和/或仅提取细胞。此示例处理数字,但我确实有包含其他类型数据的列。任何想法 ?

0 投票
4 回答
8394 浏览

python - 使用熊猫单元格中列表的长度选择行

我有一张桌子 df

只是想知道如何使用 c 列的长度来选择行

我知道这是不对的....什么应该是正确的?

0 投票
1 回答
7902 浏览

python - 将 loc 应用于 2 列值 Pandas

我想用 2 列参数定位一个数据框:如果我paises_cpm = df.loc[a]正在工作,但如果我这样做,paises_cpm = df.loc[a,b]我会收到一个错误:IndexingError: Unalignable boolean Series provided as indexer (index of the boolean Series and of the indexed object do not match

0 投票
2 回答
2123 浏览

python - Pandas Apply 和 Loc - 效率和索引

我想在满足特定条件的每一行之后找到第一个值。因此,例如,我想在增加 5% 的当前行之后找到第一个速率/值(不一定是之后的第一行)。添加的列将是最后一个“first5percentIncrease”,并且是增加了 5% 的第一行(在当前行之后)的索引(和/或值)。注意每个不能低于当前行的索引。

我尝试使用 loc 将其应用于每一行。对于大约 9k 行,输出至少需要 10 秒。这可以完成工作(我得到一个比给定行高 5% 的所有值的列表)但是有没有更有效的方法来做到这一点?此外,我只想获得第一个值,但是当我这样做时,我认为它是从第一行开始的。有没有办法从当前行开始 .locs 搜索,这样我就可以取第一个值?

进一步澄清Peter Leimbigler说得比我好:

哦,我想我现在明白了!“对于每一行,向下扫描并得到你遇到的第一行显示至少 5% 的增长,”对吗?我将编辑我的答案:) – Peter Leimbigler

0 投票
1 回答
115 浏览

python - 根据其他行值的差异在同一熊猫数据框中创建新行值

下面是一个现有的df

我希望根据“市场”列(总客户)中的行值与“市场”列(主要客户 1 + 主要客户 2)中的行值之间的值差异创建新行。我希望将“市场”列中的新行值分配为“剩余客户”并附加在同一个 df 中。

总的来说,我基本上是在尝试计算市场剩余的销售额和单位“差距”

这是我迄今为止使用 loc 尝试过的,但我不断收到一个关键错误。任何人都可以帮忙吗?

0 投票
2 回答
127 浏览

python - 使用 loc 或 iloc 编写用于过滤数据的多个条件的有效方法

我已经编写了如下代码来过滤掉名为“文档类型”的列中的记录,该列包含大约 25 个分类值。

我只是想知道是否有一种有效的编写代码的方法可以给我相同的输出?

0 投票
1 回答
766 浏览

python - Pandas 匹配 2 列中最近的日期时间值 - 类型整数/长错误

我有一个数据框,D1:

根据此链接,我正在尝试两种方法来识别最接近“ICO_to”日期值(所有行具有相同值)的“日期”值(最接近的匹配)。首先,我尝试截断,这应该删除该日期值之前的行:

但是我收到此错误:

好吧,我知道这些是日期时间值,所以不确定交易是什么。ICO_to 变量是一个时间戳。我试试这个:

使用这个而不是截断,我得到这个错误:

如何识别最接近 ICO_to 值的 Date 值,或者通过截断删除最接近匹配之前的所有行?任何一种方法都可以。

0 投票
0 回答
888 浏览

python - Pandas 日期时间匹配最近的日期 - 索引错误 'dtype='int64')' 是无效键'

我有一个 DataFrame,D1,如下所示:

我试图通过引用 Date 列(所有 ICO_to 值都相同)在 ICO_to 值之后的第 30 天将回报率提高到收盘价。这需要将最近的“日期”值与“ICO_to”日期匹配:

但我得到了错误:

...指的是最后一行 (D1['First30DReturn'])。我认为索引没有因为日期时间而增加价值?我试图通过将索引值正式转换为上面的整数来对此进行调整。这应该会返回 2017 年 6 月 28 日的收盘价 - 1.69。

为什么这个错误出现在最后一行?