问题标签 [py-datatable]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
99 浏览

python - 将聚合函数应用于数据表列并返回值,而不是数据表

也许是一个愚蠢的问题,但是..

R data.table中,如果我想获得一列的平均值,我可以引用一个列向量,并用类似foo$x的东西计算它的平均值mean(foo$x)

我不知道如何使用Python datatable进行此操作。例如,

虽然最后一条语句在技术上有效,但它似乎过于繁琐,因为它首先返回一个 1x1 datatable,我从中提取唯一的值。我正在努力解决的基本问题是,我不明白python 数据表中是否存在列向量和/或如何引用它们。

简而言之,有没有更简单的方法来计算带有 python 数据的列的平均值?

0 投票
2 回答
921 浏览

python - 尝试使用 python -m pip install datatable 在 python 3.7.4 中安装数据表时收到错误消息

当我尝试pythom -m pip install datatable在 python 3.7.4 中安装数据表时,收到以下错误消息:完整输出(26 行):

0 投票
1 回答
236 浏览

python - 如何在pydatadable中使用group by计算每个类别的实例数

我有一个如下所示的数据框,在这里我想应用 group by 并对其进行计数操作以 pydatatable 方式获取每个类别的计数?

这是一个示例 dt 包含不同的编程语言

这是我正在尝试应用组和计数操作的代码

是否有任何特定于计数的函数来代替 J ... DT[i,j,by]

0 投票
2 回答
388 浏览

python - 如何使用python的数据表按日期过滤

我有以下数据表,我想按大于“2019-01-01”的日期对其进行过滤。问题是日期是字符串。

这是我最好的尝试。

这将返回错误

TypeError: strptime() 参数 1 必须是 str,而不是 Expr

在python的数据表中过滤日期的最佳方法是什么?

参考

蟒蛇数据表

f-表达式

0 投票
1 回答
133 浏览

python - 如何在pydatatable中输入数据框列?

我正在尝试探索 pydatatable 中帧的数据类型。

这里我有一个数据框:

及其类型:

每个字段的数据类型为:

现在我想将其中的三个列投射到int, float, floatfrom float, str, str,这里。如何通过删除($,,,%)字段值中的这些特殊符号来实现?

我正在浏览文档,但我找不到关于该主题的参考。

0 投票
1 回答
376 浏览

python - 如何在pydatatable中的数据框列上设置键?

我正在练习如何对pydatatable 的数据帧执行连接操作。

第一个 DT 创建如下,

第二个 DT 创建如下,

我正在设置一个键DT_2.key = "title",因为它有重复的标题,它给出了一个键值错误:ValueError: Cannot set a key: the values are not unique

我想知道在 python 数据表中是否对键强制执行唯一性?而在R 中,数据表的唯一性没有被强制执行,并且允许重复的键值。

是否有任何参考文档?

0 投票
1 回答
407 浏览

python - 如何在 python 数据表 h2oai 中删除重复项

python中的数据表包(https://github.com/h2oai/datatable/)可以计算一列中唯一值的数量,有没有办法用这个包删除重复值或者我必须使用慢熊猫包裹?

0 投票
3 回答
334 浏览

python - 如何使用python加入多个选项卡文件

我在不同的文件夹中有多个同名的标签文件,像这样

每个文件有 5-6 个公共列,我想选择两列——基因和 FPKM。基因列相同,只是 FPKM 值不同。我想从每个文件中提取 Gene 和 FPKM 列并制作一个像这样的主文件

我做了这个

但这并不是在进行侧面合并。我如何获得上述格式?请帮忙

0 投票
2 回答
163 浏览

python - 如何修改/更新 Pydatatable 中某个条件的列值?

在pydatatable中,我正在尝试修改指定条件的列值,即DT[i=="text", j="some"]

示例 DT:

在这里我想'ABC''A'only 替换交叉值,因为我写了下面的示例代码,

尝试1:

尝试2:

这些尝试都没有解决,还有其他方法可以解决吗?您能否写信给我如何根据上述要求更新列值?

0 投票
1 回答
74 浏览

python - 如何四舍五入pydatatable中的浮动值?

我正在对数据表字段进行一些数学运算如下所示

示例 DT:

我想计算每个路口通过的公交车的百分比为

代码块

这里有一个名为 perc_of 的新字段以浮点数形式保存计算值,例如

0.287649 和 0.712351 用于穿越BroadwayCycleTrack-N

在这里,我试图利用 dt.math 模块对浮点数进行四舍五入,因为 DT 中的 F 表达式不允许 python 的入方法。

代码块:

他们没有计算出将 0.287649 舍入到 0.28 或 0.287,我应该尝试其他任何功能吗?我正在搜索它的文档,但找不到合适的文档。