问题标签 [pd]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
1010 浏览

python - 获取熊猫特定日期范围的平均值

我需要按网站对数据进行分组,并获得特定日期范围内的平均观看次数。我的数据如下所示:

所以我需要查看两个日期范围内 a 和 b 网站的平均值是多少(1/1/2021 - 1/3/2021(前)和 1/3/2021 - 1/5/2021(后))所需的输出是:

0 投票
1 回答
24 浏览

python - 使用 panda 方法更改单独的类型

我有这个 txt 并想更改ID,Foo,Bla,Bar,Timestamp. 例如,我想将 ID 更改为int64. 我怎样才能做到这一点?

0 投票
1 回答
31 浏览

python - 从 pandas DataFrame 中选择部分字符串保存在列中

我需要从 pandas df 的列中提取值并将这些值保存在单独的列中。我需要抓住遵循特定模式的字符串。我的数据如下所示:

所需的输出是:

所以我必须抓住一切在我尝试之后ADV | 和之前发生的事情:.

错误:AttributeError: 'DataFrame' object has no attribute 'split'

0 投票
1 回答
34 浏览

python - 将带有嵌套列表的字典转换为特定的 pandas df 结构

如何转换dictionary为下面的“所需输出”?

我有dictionary一个嵌套列表作为值:

期望的输出:

姓名 价值
'人 1' '一个' 1
'人 1' 'b' 2
'人2' 'C' 3
'人2' 'd' 4

当前代码:

0 投票
1 回答
122 浏览

python - 替换字符串数据框 pandas 中的第一个值

我需要用另一个值替换熊猫 df 每一行中的特定值。我的数据如下所示:

我需要替换whatswhat iswhat‚Äôs也是what is。所需的输出:

我试过了:

这解决了,whats但不是其他情况,结果不是熊猫 df,我需要它是熊猫 df。

0 投票
1 回答
96 浏览

python - 根据条件提取行 - Pandas

我想从'route_id'= 6A的df中提取所有行。

这是我尝试过的,但它返回语法错误:

有小费吗?提前致谢。

0 投票
1 回答
68 浏览

pandas - 有没有办法在数据集中组合两列,使用 Pandas 保持较大的 float64?

我会尽量保持简单,但这些是我正在使用的非常大的数据集。从理论上讲,我正在尝试合并数据框的 A 列和 B 列。但是,如果 A 连续有一个值,则 B 没有,反之亦然。那个洞充满了'NaN'

A {1,2,NaN,4,5} B {NaN,NaN,3,NaN,NaN}

我需要 A 等于 {1,2,3,4,5}

编辑:

在连接数据之前使用 df.rename(columns{"a":"b"}) 可以轻松组合它们是 NaN 上唯一的分层值层。

0 投票
1 回答
235 浏览

python - pd.concat的copy=True有什么用?

我在 pandas.concat 函数文档中阅读了有关复制参数的以下内容:

copy : bool,默认 True
如果为 False,则不要不必要地复制数据。

问题:

  1. 为什么有人要不必要地复制数据?(这似乎是因为默认值是True
  2. 有什么缺点设置copy=False吗?
0 投票
1 回答
403 浏览

pandas - 具有特定分隔符的 pandas.DataFrame 中多行的按列字符串连接

有没有一种有效的方法来连接 DataFrame 的多行的字符串,这样结果是单行,其每列的值是所有给定行的同一列的每个值的连接?

例子

如上所述组合前四行。

两个都接受的结果:

0 投票
2 回答
27 浏览

python - 创建一个布尔表,比较列中的值是否重复出现在另一列中的相似值之上

我想要实现的是以下

我有df:

我想生成 df2 ,它看起来像这样:

我已经在没有帮助的情况下尝试了 pandas 中的堆栈功能,我已经坚持了一段时间,任何帮助将不胜感激:)

提前致谢!