问题标签 [pandas-loc]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 使用其他数据框和系列快速替换熊猫数据框的信息
我目前正在尝试使用另一个 DataFrame 和一系列来替换 DataFrame 的信息以进行模拟分析。
玩具示例如下
A为用户信息DataFrame,B为服务信息DataFrame,C为用户是否更换服务的系列信息。
使用上述数据,我想更改表 A 中的信息,使用表 B 和 C 中的数据。换句话说,我希望:
我使用的代码是:
该代码有效,并提供了我想要的结果。
但是,我必须重复为一个非常大的数据集做这样的工作,我需要更快的方法来做这样的替换。
有任何想法吗?我认为重复使用.loc
是问题所在,但我还没有找到可能的解决方案。我看过pd.update()
or pd.replace()
,但它似乎不是我想要的。
python - 如何在多索引熊猫数据框中将数据滞后 x 个特定天?
我有一个包含日期、资产和价格/数量数据的 DataFrame。我试图从 7 天前提取数据,但问题是我不能使用 shift(),因为我的表中缺少日期。
我尝试创建一个 lambda 函数来尝试使用 loc 和 timedelta 来创建这种移位,但我只能输出空的 numpy 数组:
我也想过做类似的事情来填补缺失的日期,但我的问题是我有多个索引、日期和 cusips,所以我不能只重新索引这个。
pandas - Pandas 选择 DataFrame 中存在相对列值的行
假设您有一个这样的数据框:
和一些像这样的相对纪元分钟增量:
如何完成此代码块的等效项:
使用这种语法:
我理解为什么loc
选择不起作用,但我只是问是否存在一种更优雅的方法来选择有效行而不遍历数据框的行。
pandas - Pandas - 展平从应用 loc 操作返回的数据帧的对角线值
我有两个数据框——对于df
我想要查找匹配项epoch_minute - lag
并获取相应average_hc
值的每一行。
这个 for 循环可以解决问题:
它产生这个正确的系列lag
:
当我尝试与操作相同的逻辑apply
时:
它产生了这个值正确但形状不正确的数据框,而不是我期望的系列:
如何删除 nans 或展平由返回的数据帧,apply
使其成为一系列对角线值?
python - 将元组插入空的熊猫数据框中
我想在一个空的 DataFrame 中插入一行。但是,对于具有预定义索引的 DataFrame 并且当元素包含提示错误的元组或列表时,这似乎失败了:
ValueError:使用序列设置数组元素。
示例代码如下:
python - 从 pandas Dataframe 的多列中选择相同的数据
我有以下数据,
我需要有通用公式来逐行获取记录,其中在团队 1 和团队 2 中有“kk”这只是一个示例数据,我有超过 100k 行的实际数据。
python - 在 CSV 文件/Pandas Dataframe 中查找标题行的行号
我正在尝试获取包含 CSV 文件中标题的行的索引或行号。问题是,标题行可以根据我们系统报告的输出上下移动(我无法控制更改)
代码:
如果我要打印测试,我希望有一个大约 4 或 5 的数字,这就是我在第二次读取“read_csv”中输入的内容
我得到的错误是它需要 1 个标题列,但我有 26 个列。我只是想使用第一个标题字符串来获取行号
谢谢 :-)
编辑:
CSV 格式
正如您将看到的“截止日期”行是相同的,根据代码 ID,这可以是 3 或 5,因此标题行可以向上或向下更改。
我也没有写出所有 26 个列标题,不确定这是否重要。
想要DF格式
希望这是有道理的..
谢谢,
python - 设置数据框列返回持久的“值正在尝试在切片的副本上设置”警告
我知道链接 get/set 的含义以及它可能意味着我正在处理副本这一事实。如果我使用loc()
,我仍然会收到警告(没有 loc 部分,但仍然是警告)。
我有一个带有“A”列的 DF,它是一个日期,但带有一个类型字符串。
我将字符串对象转换为日期(在所有行):
然后我将其转回以特定方式格式化的字符串。我知道我在这里绕道而行,但我想尝试一下:
然后我相应地将列拆分为多列:
这一切似乎都在起作用,但我明白了"A value is trying to be set on a copy of a slice from a DataFrame. Try to use loc..." warning three times.
我还尝试在分配的 LH 上创建新列,以免尝试同时获取和设置相同的列。警告仍然存在。
这样做的正确方法是什么?我想设置原始数据框。
python - 根据熊猫中的条件更改数据框的第一行
我有 2 列的值,我只想更新 1 行的第三列。
我有-
如果 A= 1 且 B=2 则只有第一行的 C=1 像这样 -
现在我用过
但它不会改变数据框。