问题标签 [py-datatable]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 更改python Datatable中的列类型
是否可以在 python数据表中更改stypes.int8
为?stypes.int32
python - 如何在pydatatable数据框中根据条件(ifelse)创建列并填写值?
我创建了一个数据表框架,如下所示,
在这里,我想在特定条件下添加一个新列(profit_or_loss)
如果收入大于 2500,则应在新创建的列中填写值“利润”,否则应填写另一个值“损失”。
这是另一个案例:
在新列(利润损失)中,如果满足此条件,国内收入>国际收入,则其值应填写为“利润”,否则填写“损失”
注意:这是 R 数据表中的一种 fifelse 功能。
python - 如何过滤Pydatatable框架的I表达式中传递的多个值的观察?
我有一个包含两列的数据框,如下所示,
在第一种情况下,我想过滤其电影是 Don 或 Chicago 的观察结果,如下面的代码所示,
在一秒钟内,我会为 3 个值应用过滤器,
如果过滤超过 5 或 10 个值,我们应该为这些值做一个逻辑表达式,这肯定是一项耗时的任务。
有什么数据表方法可以更快地完成它吗?就像 R 中有一些%in%
%chin%
过滤选项一样data.table
。
python - 如何在数据表框架中按组查找唯一值
我创建了一个数据表框架,如下所示,
在这里,我有三个独特的客户生命周期,每个计数都被发现为
除此之外,我还有五个客户 ID,这些计数为
现在我想看看每个客户生命周期中存在多少个唯一客户 ID,
它应该显示为潜在客户有 3 个唯一的客户 ID,例如 (1,2,5),活动用户有 2 个唯一的客户 ID (2,4),依此类推。
我无法按预期得到它,你能告诉我如何修复它吗?
仅供参考:我试图在 R data.table 框架上重现相同的内容,它的工作原理。
python - 在python的数据表框架中将字符串列转换为日期格式
举个简单的例子:
只有一个名为 Date 的列有两个 str32 类型的值。
如何将日期列转换为数据表框架中的日期格式。
我努力了
但结果显示如下:
我认为它仍然不是日期格式。
即使我查看了每列的类型,我仍然不知道:
有没有办法解决这个问题或任何替代方案?
谢谢回答。
python - 在 pydatatable 数据框中使用 f 表达式选择必填字段的建议
我创建了一个数据表框架,
现在我试图从数据表中只选择 2 个字段,
在这种情况下,它显示从数量到销售额的数据,而它应该以指定的顺序(销售额,数量)显示它们。从这个输出中得到的另一个观察结果是,数量字段按升序排序。
保留这种情况,现在我尝试将括号中的必填字段传递为
这里它现在产生正确的输出,没有任何排序/混乱的字段
始终建议在括号中传递要选择的字段。
最后,我很想知道第一种情况发生了什么?,你能解释清楚吗?
python - 如何从具有不同键值的字典创建 pydatatable 数据框?
我正在尝试实现一个功能,将更长的列转换为 pydatatable 中的更宽的列,在这个过程中,我遇到了一个字典问题,每个键的大小不同,如下面的代码所示。
我将此字典传递给 Frame 对象
这里它抛出一个错误
ValueError:第 1 列的行数 (5) 与前面的列 (4) 不同
很明显,当数据结构传递给 Frame 时,每个键都应该具有相同大小的值。那么,是否有任何选项可以像 Force 一样将 NA 填充到具有较小值的键中,以便每个键的大小相等。
你有什么其他的建议吗?
python - 如何从 pydatatable 数据框中删除列列表?
我有一个数据表框架创建为:
我创建了一个自定义函数来从框架中选择所需列的列表DT
,
因此,这是从 DT 中删除列的推荐语法:
按照上面的 DT 语法,我创建了另一个自定义函数来将列列表保留为
我正在执行该功能
它抛出了错误
TypeError:计算列不能用于
.remove()
你能帮我怎么做吗?
python - 如何过滤pydatatable中列组的NA值?
我创建了一个包含 3 组不同观察值的数据表,
它的输出为,
现在我在数据表的前 3 个字段上应用了推荐的分组,其他剩余列(牛肉、鸡蛋、叉子、蔬菜)的聚合(总和)为
它的输出为-
这里它给出了一个正确的输出,但是它添加了重复的列,另一个观察是它用 0 填充 NA 值,它可以在 C 观察中找到。
在这里我做了一些解决方法
及其输出为,
但我认为这不是一个可行的解决方案,因为我总是必须指定要隐藏在 .remove 函数中的列,
您对此有任何其他想法/建议吗?