问题标签 [py-datatable]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
234 浏览

python - Python 数据表:sum、groupby、column < 0

嗨,我正在努力将一些 R 代码翻译成 Python 代码。

这是我的 R 代码:

到目前为止,这是我的 Python 代码:

我不知道如何包含流入和流出列的子集。任何人都可以帮忙吗?

这是所需的输出(使用 R 代码生成):

样本数据:

0 投票
3 回答
774 浏览

python - python数据表,列上的字符串操作

如何删除a列中的“A”并将其分配给新列“c”作为数据表中的数字(即不带熊猫)?

在以下的帮助下看起来像这样pandas

数据表本机版本不太好用

顺便说一句,对于 python pandas 和 R data.table 的频繁用户,是否有一个高级/完整的食谱可以帮助从 R data.table 过渡到 py-datatable?网站上有一个页面,但还不够。

0 投票
1 回答
184 浏览

python - 如何在 O(1) 中按键列选择行?(Python 数据表)

如何在 O(1) 中按键值获取行?

我在文档中找到的唯一选择行的方法是行选择器,它似乎没有利用列的键控状态。

例如在此表中:

与按行号访问相比,使用行选择器访问真的很慢:

由于该列是键控的,我的期望是能够在 O(1) 中访问,但我不知道实现这一目标的正确方法。

0 投票
0 回答
150 浏览

python - 在 python 数据表(不是 pandas 数据框)上应用用户定义的函数?

Datatable 在 R 中很流行,但它也有Python 版本。但是,我在文档中没有看到任何关于在数据表上应用用户定义函数的内容。

这是一个玩具示例(在 pandas 中),其中将用户函数应用于数据帧以查找邮箱地址:

有没有办法在数据表中执行此 .apply 操作?会很好,因为对于大多数操作来说,datatable 似乎比 pandas 快很多。

0 投票
0 回答
872 浏览

python - 如何将 pandas.DataFrame 转换为包含 Int32(可为空整数)的 datatable.Frame?

我有一个pandas.DataFrame包含pandas 可为空的整数数据类型,并希望将其转换为等效datatable.Frame对象。但是,这似乎不是直接可能的。在不破坏东西的情况下进行转换的最佳方法是什么?我没有以文本形式提供的 DataFrame,但它们来自pickle. MWE:

0 投票
1 回答
660 浏览

python - 如何在python数据表中填充空值?

Pandas 库有一个非常好的函数调用 .fillna() 可用于填充空值

我正在为我的新任务使用 Datatable Library,因为它在 Datatable 中加载和处理大量数据非常快。

fillnapython的Datatable库中是否存在这样的功能?

或者我们必须用什么替代方法来填充 Datatable 中的缺失值?

0 投票
1 回答
42 浏览

python - 为什么在对 pydatatable 中的多个列应用分组后会创建重复列?

我有一个pydatatable,

我正在尝试过滤掉重复的行

它的输出为-

在这里,它删除了重复的观察结果,为什么它在B 和 C 上创建重复的列 B.0 C.0

0 投票
1 回答
31 浏览

python - 如何根据 pydatatable 中指定的索引选择观察值?

我有一个数据表 -

我现在要选择一个在 C 列中有 api 的观察值 -

好的,现在我想找到一个与这个观察相关的索引,这样我就可以在数据表中从这个索引开始选择观察,

例如,上面的观察在 DT 中有第 4 行,我可以选择从第 4 开始的观察作为 -

但是,如果在 DT 中有数百万个观察值,我无法计算出所需的观察指数。

0 投票
0 回答
38 浏览

python - 在 pydatatable 中使用 fread 加载 CSV 时出错

我有一个 csv 包含大约 600K 观察值,我正在使用 fread 导入它

它抛出一个错误 -

正如这里所建议的,我在 fread 语句中传递了参数 fill=True 。

它执行,但 DT 将被创建为 EMPTY。

如何解决?

0 投票
0 回答
59 浏览

python - Python数据表包中的内存不足操作:怎么做?

Python数据表 文档页面声明它支持内存不足的数据集。我找不到这种操作的例子,所以我正在寻找那个。

谢谢