问题标签 [py-datatable]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
114 浏览

python - 使用 R 数据表的 .SDcols 样式的 pydatatable 更新或添加多列

给定虹膜数据,我想添加与找到的所有数字列相对应的新列。我可以通过明确列出每个数字列来做到:

但是这样我就硬编码了列名。使用 R 数据表可以轻松获得更强大的方法.SDcols

今天有没有办法对 pydatatable 采取类似的方法?

我确实意识到如何获取 py-datatable 中的所有数字列,例如:

但这是.SDcols在 R 中使用的最后一部分,它避开了我。

0 投票
4 回答
442 浏览

python - 如何正确地将整数数据表(来自 Python 数据表库)转换为 pandas Dataframe

我正在使用 Python 数据表(https://github.com/h2oai/datatable)读取仅包含整数值的 csv 文件。之后,我将数据表转换为熊猫数据框。在转换时,仅包含 0/1 的列被视为布尔值而不是整数。

让下面的 csv 文件(small_csv_file_test.csv):

源代码:

结果:

[5 行 x 10 列]

编辑 1: a8、a9 和 a10 列不正确,我希望它们作为整数值而不是布尔值。

谢谢您的帮助。

0 投票
1 回答
239 浏览

python - py-datatable 用 NaN 替换列中的空字符串

在 python 数据表中,我想用 NaN 替换空字符串。当我尝试时,我收到以下错误。它适用于熊猫。在此先感谢您的帮助。

我试过的数据表语法:

收到错误:

无法用''<class 'float'> 类型的值替换字符串值

有效的熊猫语法:

0 投票
1 回答
829 浏览

python - 如何在python中组合(合并)两个数据表Frame

给定两个数据表 Frame。如何将它们组合(合并)在一帧中?

dt_f_A =

dt_f_B =

预期结果 (dt_f_A concat(combine or merge) dt_f_B)

我们考虑三种情况:

案例1: a)两个框架具有完全相同的行数,并且b)列中的 唯一属性

情况2:行数不同

案例3:属性不唯一(有重复)

@sammywemmy 感谢您的宝贵意见。

0 投票
1 回答
23 浏览

linux - 如何从 git repo 构建 python 数据表

我已经从我的 linux 机器上的https://github.com/h2oai/datatable克隆了 git repo。如何从本地计算机上保存的克隆副本构建数据表?谢谢。

0 投票
0 回答
15 浏览

py-datatable - 测试套件无法运行

我按照https://datatable.readthedocs.io/en/latest/start/install.html中的说明从 git repo 构建数据表。当我运行以可编辑模式安装数据表部分中的第 5 步时,我的测试失败。我附上了我的错误日志的一部分。

错误日志

0 投票
1 回答
67 浏览

python - 如何聚合`dict`类型的列

我有一个Frame如下:

看起来像这样:

我要做的是 1) group byk和 2) 汇总字典中的计数。所需的输出:

是否可以使用最新的pydatatable(v0.11)实现?

0 投票
1 回答
111 浏览

python - 如何在pydatatable中加入两个具有不同键列名的数据框?

我有一个 X 数据框,

另一个数据框 Y 为,

现在我想对 X 和 Y 执行 JOIN 操作,因为我应该在 X 数据帧上分配一个键,

接下来我将 X 和 Y 加入为 ,

在这里它抛出一个错误,

当然DT_Y 中不存在日期,它的列名为stop_date

在这种情况下如何执行连接操作??即列名不匹配。

注意

解决此问题的方法是将 DT_Y 的列名更改为

加入的 DT 可以被视为,

这是预期的输出:

0 投票
3 回答
91 浏览

python - 如何取消选择pydatatable中特定索引处的行?

我有一个如下的数据表,

这里第 0 行和第 3 行是重复的,我想将第 3 行保留在一边。

在此示例中,我将其尝试为-

它过滤了两个观察值,如下所示,

但是,我希望有一个第一个观察结果,即索引为 0 并过滤掉第三行。

如何在 pydatatable 中实现?如何使用索引检索数据表行?

0 投票
1 回答
242 浏览

python - 将完整 DT 中的所有“NA”替换为 0(Python 数据表)

嗨,我正在使用 Python 数据表包,在加入两个 DT 后需要替换所有“NA”。

样本数据:

下面的代码将所有 1 替换为 0

我应该如何调整它来替换“NA”?或者是否可以选择在从“NA”加入“0”时更改填充?谢谢你。