问题标签 [pd]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
39 浏览

python - Python无法运行程序

所以我已经在这个程序上工作了一段时间,由于某种原因,Spyder (Anaconda) 无法运行该程序。我猜这有点像一个未闭合的循环,但我无法查明任何东西,因为 Spyder 甚至不会给我一个错误。只是无法运行程序。这是完整的程序:

这是我使用的 .csv 的摘录:small business.csv 截图放在这里 非常感谢任何帮助!

0 投票
0 回答
29 浏览

python - 是否可以在单行上使用 pandas.replace 函数?

我目前正在处理一个非常大的数据集,需要使用字典(同样非常大)替换数据框中单行中的所有值。

使用时替换值非常好:

然而,由于数据集很大,这需要相当长的时间。我不知道如何将替换功能应用于单行。

有人有想法吗?

提前致谢

0 投票
2 回答
118 浏览

python - 熊猫,访问嵌套数组中的每个第 n 个元素

我有一个多行 4 列的数据框。每列包含一个包含 100 个值的数组。

我这样做的直观方式与使用多维 numpy 数组的方式相同。

例如,我想要column1. 所以我说

对我来说这是有道理的:首先选择列,然后获取每个数组,然后获取每个数组的第一个元素。

但是,它根本不起作用。相反,它只是从第 1 行吐出整个数组column1

但是 - 这是最令人沮丧的事情 - 如果我说:

根据我的预期逻辑,它完全符合我的预期,例如,我在column1.

如何获取每个数组中的每个第 n 个元素column1

0 投票
0 回答
23 浏览

python - 使用熊猫从表格框中提取数据

我需要从 html 页面中提取一些数据,这些数据在一个表中,我使用 panda 创建了一个包含我想要的数据的表,问题是我将一些数据放在一起并在同一行中,我这样做了不想,我不知道如何确保不会发生。附上代码。我希望表格左侧的数字打印在列表中,问题是列表打印了不需要的元素(farht 422)..

0 投票
1 回答
90 浏览

python - Pandas if else 以时间戳类型为条件

日期列是时间戳。如果日期小于“2021-01-15”,我希望编写一个 if-else 条件来操纵已售为 0,如果日期大于或等于“2021-01-15”,则保持原样。但我不断收到此错误:TypeError: unsupported operand type(s) for &: 'str' and 'Timestamp'

0 投票
1 回答
19 浏览

python - py pd DataFrame Timestamp to string 转换错误(ValueError: cannot set a Timestamp with a non-timestamp str)

上周,以下代码可以很好地将时间戳转换为 DataFrame 中的字符串:

今天,没有更改库或代码的其他部分,我有错误:

我注意到直接从shell没有问题:

经过一些尝试后,我解决了修改代码如下:

问题显然是将 df_string 直接分配给前一个 df_timestamp 列。

这是正常的还是您看到更好的解决方案来避免错误?

0 投票
1 回答
27 浏览

python - 当其他两列具有相同值时从一列获取

我需要一个具有相同 K 和 i 的“设置”列的值的新 df。1-1, 2-2, 3-3,4-4..

我需要值 234、1123、3、..

0 投票
0 回答
7 浏览

dataframe - 如何根据python DataFrame中的关键字删除一行

我有一个要与数据框匹配的关键字,如果找到,我们想从数据框中删除包含该关键字的行

输入是以下格式的数据帧 PD

关键字是运动员

输出应该是

任何建议表示赞赏

0 投票
2 回答
18 浏览

python - 获取 pandas 中某些日期范围的平均值

我需要按 customer_id 对数据进行分组并获取购买日期间隔的平均值。我的数据如下所示:

所以我需要看看每个客户的平均日期范围是多少。所需的输出是:

0 投票
1 回答
14 浏览

pandas - 如何根据两列组合属性

我有一个从网络导入的熊猫数据框,如下所示。

不幸的是,袋子大小的值在不同的行中。

姓名 长度 宽度 高度
詹姆士 一个 15.32
詹姆士 一个 27.33
詹姆士 20.69
詹姆士 15.87
奥西内斯 一个 17.88
奥西内斯 一个 18.94
奥西内斯 一个 14.56
奥西内斯 16.82

我想根据“名称”和“袋”列在一行中表达尺寸属性,如下所示:

姓名 长度 宽度 高度
詹姆士 一个 15.32 27.33
詹姆士 15.87 20.69
奥西内斯 一个 17.88 18.94 14.56
奥西内斯 16.82

我怎么解决这个问题?如果你能帮助我,我将不胜感激。