问题标签 [py-datatable]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 使用 R 数据表的 .SDcols 样式的 pydatatable 更新或添加多列
给定虹膜数据,我想添加与找到的所有数字列相对应的新列。我可以通过明确列出每个数字列来做到:
但是这样我就硬编码了列名。使用 R 数据表可以轻松获得更强大的方法.SDcols
:
今天有没有办法对 pydatatable 采取类似的方法?
我确实意识到如何获取 py-datatable 中的所有数字列,例如:
但这是.SDcols
在 R 中使用的最后一部分,它避开了我。
python - 如何正确地将整数数据表(来自 Python 数据表库)转换为 pandas Dataframe
我正在使用 Python 数据表(https://github.com/h2oai/datatable)读取仅包含整数值的 csv 文件。之后,我将数据表转换为熊猫数据框。在转换时,仅包含 0/1 的列被视为布尔值而不是整数。
让下面的 csv 文件(small_csv_file_test.csv):
源代码:
结果:
[5 行 x 10 列]
编辑 1: a8、a9 和 a10 列不正确,我希望它们作为整数值而不是布尔值。
谢谢您的帮助。
python - py-datatable 用 NaN 替换列中的空字符串
在 python 数据表中,我想用 NaN 替换空字符串。当我尝试时,我收到以下错误。它适用于熊猫。在此先感谢您的帮助。
我试过的数据表语法:
收到错误:
无法用
''
<class 'float'> 类型的值替换字符串值
有效的熊猫语法:
python - 如何在python中组合(合并)两个数据表Frame
给定两个数据表 Frame。如何将它们组合(合并)在一帧中?
dt_f_A =
dt_f_B =
预期结果 (dt_f_A concat(combine or merge) dt_f_B)
我们考虑三种情况:
案例1: a)两个框架具有完全相同的行数,并且b)列中的 唯一属性。
情况2:行数不同
案例3:属性不唯一(有重复)
@sammywemmy 感谢您的宝贵意见。
linux - 如何从 git repo 构建 python 数据表
我已经从我的 linux 机器上的https://github.com/h2oai/datatable克隆了 git repo。如何从本地计算机上保存的克隆副本构建数据表?谢谢。
py-datatable - 测试套件无法运行
我按照https://datatable.readthedocs.io/en/latest/start/install.html中的说明从 git repo 构建数据表。当我运行以可编辑模式安装数据表部分中的第 5 步时,我的测试失败。我附上了我的错误日志的一部分。
python - 如何聚合`dict`类型的列
我有一个Frame
如下:
看起来像这样:
我要做的是 1) group byk
和 2) 汇总字典中的计数。所需的输出:
是否可以使用最新的pydatatable
(v0.11)实现?
python - 如何在pydatatable中加入两个具有不同键列名的数据框?
我有一个 X 数据框,
另一个数据框 Y 为,
现在我想对 X 和 Y 执行 JOIN 操作,因为我应该在 X 数据帧上分配一个键,
接下来我将 X 和 Y 加入为 ,
在这里它抛出一个错误,
当然DT_Y 中不存在日期,它的列名为stop_date。
在这种情况下如何执行连接操作??即列名不匹配。
注意:
解决此问题的方法是将 DT_Y 的列名更改为
加入的 DT 可以被视为,
这是预期的输出:
python - 如何取消选择pydatatable中特定索引处的行?
我有一个如下的数据表,
这里第 0 行和第 3 行是重复的,我想将第 3 行保留在一边。
在此示例中,我将其尝试为-
它过滤了两个观察值,如下所示,
但是,我希望有一个第一个观察结果,即索引为 0 并过滤掉第三行。
如何在 pydatatable 中实现?如何使用索引检索数据表行?
python - 将完整 DT 中的所有“NA”替换为 0(Python 数据表)
嗨,我正在使用 Python 数据表包,在加入两个 DT 后需要替换所有“NA”。
样本数据:
下面的代码将所有 1 替换为 0
我应该如何调整它来替换“NA”?或者是否可以选择在从“NA”加入“0”时更改填充?谢谢你。