问题标签 [pandas-loc]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 使用python选择具有相同索引的dataFrame中的行
我想问你,如何在 DataFrame 中选择具有相同索引号的行。例子:
我预计:
df1=
我正在使用df.loc[2]
但只显示第一组数据。也使用df1=df.set_index(['2'])
过,也不起作用。提前致谢!
pandas - Pandas 数据框通过 .loc 一次创建多行
我可以使用以下方法在数据框中创建一个新行.loc()
:
但是如何使用相同的方法创建多行?
我熟悉 .append() 但我正在寻找一种不需要在将新行附加到 Series 之前将其构造到 Series 中的方法df
。
所需输入:
期望的输出
最后两行是新添加的。
python - 如何将 iterrows if 语句转换为 Pandas 中的矢量化函数或其他更快的方法
我一直在寻找一种方法来用矢量化替换 itterrows 并出现空白。我有这段代码,我相信使用 itterows 可以正常工作,这将永远持续下去。
总而言之,这是在当前为 ~0 且 active = 1 时存储该点的经过时间(第一次为真)并且新列应为 1。然后,如果这些条件在“时间”内保持为真,则新列中的值更改为 2。如果 current 超出 0,则新列应返回 0 并再次开始查找 current == 0 和 active == 1。
非常感谢任何帮助或建议。
python - 使用变量时,Pandas loc 无法对 DataFrame 进行子集化
我对 Python 很陌生,尤其是 pandas。我有一个名为 KeyRow 的 DataFrame,它来自更大的 df:
然后我做一个嵌套循环
因此,它似乎仅在放置常量时才起作用,而如果我使用 PersonNum[0] 而不是 '6',即使两个值相等,它似乎也不起作用。当我使用 PersonNum[i] 这是我得到的输出:
而如果我使用'x',我会得到想要的结果:
python - Pandas df.loc 比较浮点条件从不工作
印刷
所以我试图将 Dataframe 拆分为子集,但我放入 df.loc 的条件永远不会起作用!
df_realty 中的数据是可以的,已经测试过了。
似乎我必须明确一些类型转换,但我已经做了一个(pd.to_numeric)
有什么建议么?
python - 在python中按数据框列中的每个值分组
我有一个包含 7 列的数据框,如下所示:
我想为每个创建一个包含 4 个元素的元组ID
,这样每个元组元素代表每个元组(Bank Name, Number, Firstname, Lastname)
,ID
并且这些元组元素的值是该 ID 的相应列中存在的不同元素的计数。例如:对于ID = 12
,元组应该是(2, 2, 2, 1)
元ID=13,
组应该是(3, 3, 2, 3)
通过执行以下操作,我可以获取特定 ID 的所有行:
但是,我不知道如何对 ID 列中的每个值执行此操作(很像 SQL 中的 group by 子句,并且还获取计数而不是行中的实际值。
请帮忙。
python - python pandas loc - 过滤值列表
这应该非常容易,但我无法让它工作。
我想根据两个或多个值过滤我的数据集。
这必须是 OR 语句吗?我可以在 SQL 中使用 in?
python - Pandas 为什么/如何在 .loc 和 .iloc 中使用方括号?
所以 .loc 和 .iloc 不是你的典型函数。他们以某种方式使用 [ 和 ] 来包围参数,以便它与普通数组索引相当。但是,我从未在另一个库中看到过这个(我可以想到,也许 numpy 就像我正在空白的东西),而且我不知道它在技术上是如何工作的/在 python 代码中定义的。
在这种情况下,括号是否只是函数调用的语法糖?如果是这样,那么如何使任意函数使用括号而不是括号?否则,它们的使用/定义 Pandas 有什么特别之处?
python - 在 groupby 之后选择不同的列
我是熊猫新手,因此请耐心对待这个问题我有一个 Df,其中包含多年来收集的年份、州和人口数据
我想找到任何一年的最大流行音乐和相应的状态
例子:
我做了一个groupby,得到了一年内所有州的人口;我如何迭代这些年来
现在我做到了
只给我 1 年和所有年份和州的最大值 我想要的是每年哪个州的人口最多
建议?