问题标签 [py-datatable]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

94 问题

0 投票

2 回答

444 浏览

python - 更改python Datatable中的列类型

是否可以在 python数据表中更改stypes.int8为？stypes.int32

python py-datatable

2020-04-27T07:59:01.220

0 投票

1 回答

47 浏览

python - 如何在pydatatable数据框中根据条件（ifelse）创建列并填写值？

我创建了一个数据表框架，如下所示，

在这里，我想在特定条件下添加一个新列（profit_or_loss）

如果收入大于 2500，则应在新创建的列中填写值“利润”，否则应填写另一个值“损失”。

这是另一个案例：

在新列（利润损失）中，如果满足此条件，国内收入>国际收入，则其值应填写为“利润”，否则填写“损失”

注意：这是 R 数据表中的一种 fifelse 功能。

python py-datatable

2020-04-27T13:35:36.177

0 投票

1 回答

139 浏览

python - 如何过滤Pydatatable框架的I表达式中传递的多个值的观察？

我有一个包含两列的数据框，如下所示，

在第一种情况下，我想过滤其电影是 Don 或 Chicago 的观察结果，如下面的代码所示，

在一秒钟内，我会为 3 个值应用过滤器，

如果过滤超过 5 或 10 个值，我们应该为这些值做一个逻辑表达式，这肯定是一项耗时的任务。

有什么数据表方法可以更快地完成它吗？就像 R 中有一些%in% %chin%过滤选项一样data.table。

python py-datatable

2020-04-29T05:36:53.547

0 投票

2 回答

238 浏览

python - 如何在数据表框架中按组查找唯一值

我创建了一个数据表框架，如下所示，

在这里，我有三个独特的客户生命周期，每个计数都被发现为

除此之外，我还有五个客户 ID，这些计数为

现在我想看看每个客户生命周期中存在多少个唯一客户 ID，

它应该显示为潜在客户有 3 个唯一的客户 ID，例如 (1,2,5)，活动用户有 2 个唯一的客户 ID (2,4)，依此类推。

我无法按预期得到它，你能告诉我如何修复它吗？

仅供参考：我试图在 R data.table 框架上重现相同的内容，它的工作原理。

python py-datatable

2020-05-03T16:45:56.430

0 投票

1 回答

587 浏览

python - 在python的数据表框架中将字符串列转换为日期格式

举个简单的例子：

只有一个名为 Date 的列有两个 str32 类型的值。

如何将日期列转换为数据表框架中的日期格式。

我努力了

但结果显示如下：

我认为它仍然不是日期格式。

即使我查看了每列的类型，我仍然不知道：

有没有办法解决这个问题或任何替代方案？

谢谢回答。

python datetime python-datetime date-manipulation py-datatable

2020-05-17T12:06:32.630

0 投票

1 回答

35 浏览

python - 在 pydatatable 数据框中使用 f 表达式选择必填字段的建议

我创建了一个数据表框架，

现在我试图从数据表中只选择 2 个字段，

在这种情况下，它显示从数量到销售额的数据，而它应该以指定的顺序（销售额，数量）显示它们。从这个输出中得到的另一个观察结果是，数量字段按升序排序。

保留这种情况，现在我尝试将括号中的必填字段传递为

这里它现在产生正确的输出，没有任何排序/混乱的字段

始终建议在括号中传递要选择的字段。

最后，我很想知道第一种情况发生了什么？，你能解释清楚吗？

python py-datatable

2020-05-18T08:54:20.233

0 投票

1 回答

42 浏览

python - 如何从具有不同键值的字典创建 pydatatable 数据框？

我正在尝试实现一个功能，将更长的列转换为 pydatatable 中的更宽的列，在这个过程中，我遇到了一个字典问题，每个键的大小不同，如下面的代码所示。

我将此字典传递给 Frame 对象

这里它抛出一个错误

ValueError：第 1 列的行数 (5) 与前面的列 (4) 不同

很明显，当数据结构传递给 Frame 时，每个键都应该具有相同大小的值。那么，是否有任何选项可以像 Force 一样将 NA 填充到具有较小值的键中，以便每个键的大小相等。

你有什么其他的建议吗？

python py-datatable

2020-05-21T05:08:06.510

0 投票

1 回答

108 浏览

python - 如何从 pydatatable 数据框中删除列列表？

我有一个数据表框架创建为：

我创建了一个自定义函数来从框架中选择所需列的列表DT，

因此，这是从 DT 中删除列的推荐语法：

按照上面的 DT 语法，我创建了另一个自定义函数来将列列表保留为

我正在执行该功能

它抛出了错误

TypeError：计算列不能用于.remove()

你能帮我怎么做吗？

python py-datatable

2020-05-22T16:38:39.697

0 投票

2 回答

60 浏览

python - 如何过滤 pydatatable 列中的 NA 值？

我有一个数据表，

它的输出如下，

我想将其转换为列中不应包含 NA 的数据表，如此输出所示，

您能否解释一下如何在 py-datatable 上执行此操作（删除 NA）？dt.isna() 在这种情况下会有所帮助吗？

python py-datatable

2020-05-23T12:53:04.567

0 投票

1 回答

76 浏览

python - 如何过滤pydatatable中列组的NA值？

我创建了一个包含 3 组不同观察值的数据表，

它的输出为，

现在我在数据表的前 3 个字段上应用了推荐的分组，其他剩余列（牛肉、鸡蛋、叉子、蔬菜）的聚合（总和）为

它的输出为-

这里它给出了一个正确的输出，但是它添加了重复的列，另一个观察是它用 0 填充 NA 值，它可以在 C 观察中找到。

在这里我做了一些解决方法

及其输出为，

但我认为这不是一个可行的解决方案，因为我总是必须指定要隐藏在 .remove 函数中的列，

您对此有任何其他想法/建议吗？

python py-datatable

2020-05-24T03:10:31.433

1 2 3 4 5 6 7 8 9 10