问题标签 [py-datatable]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
444 浏览

python - 更改python Datatable中的列类型

是否可以在 python数据表更改stypes.int8为?stypes.int32

0 投票
1 回答
47 浏览

python - 如何在pydatatable数据框中根据条件(ifelse)创建列并填写值?

我创建了一个数据表框架,如下所示,

在这里,我想在特定条件下添加一个新列(profit_or_loss)

如果收入大于 2500,则应在新创建的列中填写值“利润”,否则应填写另一个值“损失”。

这是另一个案例:

在新列(利润损失)中,如果满足此条件,国内收入>国际收入,则其值应填写为“利润”,否则填写“损失”

注意:这是 R 数据表中的一种 fifelse 功能。

0 投票
1 回答
139 浏览

python - 如何过滤Pydatatable框架的I表达式中传递的多个值的观察?

我有一个包含两列的数据框,如下所示,

在第一种情况下,我想过滤其电影是 Don 或 Chicago 的观察结果,如下面的代码所示,

在一秒钟内,我会为 3 个值应用过滤器,

如果过滤超过 5 或 10 个值,我们应该为这些值做一个逻辑表达式,这肯定是一项耗时的任务。

有什么数据表方法可以更快地完成它吗?就像 R 中有一些%in% %chin%过滤选项一样data.table

0 投票
2 回答
238 浏览

python - 如何在数据表框架中按组查找唯一值

我创建了一个数据表框架,如下所示,

在这里,我有三个独特的客户生命周期,每个计数都被发现为

除此之外,我还有五个客户 ID,这些计数为

现在我想看看每个客户生命周期中存在多少个唯一客户 ID,

它应该显示为潜在客户有 3 个唯一的客户 ID,例如 (1,2,5),活动用户有 2 个唯一的客户 ID (2,4),依此类推。

我无法按预期得到它,你能告诉我如何修复它吗?

仅供参考:我试图在 R data.table 框架上重现相同的内容,它的工作原理。

0 投票
1 回答
587 浏览

python - 在python的数据表框架中将字符串列转换为日期格式

举个简单的例子:

只有一个名为 Date 的列有两个 str32 类型的值。

如何将日期列转换为数据表框架中的日期格式。

我努力了

但结果显示如下:

我认为它仍然不是日期格式。

即使我查看了每列的类型,我仍然不知道:

有没有办法解决这个问题或任何替代方案?

谢谢回答。

0 投票
1 回答
35 浏览

python - 在 pydatatable 数据框中使用 f 表达式选择必填字段的建议

我创建了一个数据表框架,

现在我试图从数据表中只选择 2 个字段,

在这种情况下,它显示从数量到销售额的数据,而它应该以指定的顺序(销售额,数量)显示它们。从这个输出中得到的另一个观察结果是,数量字段按升序排序。

保留这种情况,现在我尝试将括号中的必填字段传递为

这里它现在产生正确的输出,没有任何排序/混乱的字段

始终建议在括号中传递要选择的字段。

最后,我很想知道第一种情况发生了什么?,你能解释清楚吗?

0 投票
1 回答
42 浏览

python - 如何从具有不同键值的字典创建 pydatatable 数据框?

我正在尝试实现一个功能,将更长的列转换为 pydatatable 中的更宽的列,在这个过程中,我遇到了一个字典问题,每个键的大小不同,如下面的代码所示。

我将此字典传递给 Frame 对象

这里它抛出一个错误

ValueError:第 1 列的行数 (5) 与前面的列 (4) 不同

很明显,当数据结构传递给 Frame 时,每个键都应该具有相同大小的值。那么,是否有任何选项可以像 Force 一样将 NA 填充到具有较小值的键中,以便每个键的大小相等。

你有什么其他的建议吗?

0 投票
1 回答
108 浏览

python - 如何从 pydatatable 数据框中删除列列表?

我有一个数据表框架创建为:

我创建了一个自定义函数来从框架中选择所需列的列表DT

因此,这是从 DT 中删除列的推荐语法:

按照上面的 DT 语法,我创建了另一个自定义函数来将列列表保留为

我正在执行该功能

它抛出了错误

TypeError:计算列不能用于.remove()

你能帮我怎么做吗?

0 投票
2 回答
60 浏览

python - 如何过滤 pydatatable 列中的 NA 值?

我有一个数据表,

它的输出如下,

在此处输入图像描述

我想将其转换为列中不应包含 NA 的数据表,如此输出所示,

在此处输入图像描述

您能否解释一下如何在 py-datatable 上执行此操作(删除 NA)?dt.isna() 在这种情况下会有所帮助吗?

0 投票
1 回答
76 浏览

python - 如何过滤pydatatable中列组的NA值?

我创建了一个包含 3 组不同观察值的数据表,

它的输出为,

现在我在数据表的前 3 个字段上应用了推荐的分组,其他剩余列(牛肉、鸡蛋、叉子、蔬菜)的聚合(总和)为

它的输出为-

这里它给出了一个正确的输出,但是它添加了重复的列,另一个观察是它用 0 填充 NA 值,它可以在 C 观察中找到。

在这里我做了一些解决方法

及其输出为,

但我认为这不是一个可行的解决方案,因为我总是必须指定要隐藏在 .remove 函数中的列,

您对此有任何其他想法/建议吗?