问题标签 [py-datatable]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python 数据表:sum、groupby、column < 0
嗨,我正在努力将一些 R 代码翻译成 Python 代码。
这是我的 R 代码:
到目前为止,这是我的 Python 代码:
我不知道如何包含流入和流出列的子集。任何人都可以帮忙吗?
这是所需的输出(使用 R 代码生成):
样本数据:
python - python数据表,列上的字符串操作
如何删除a
列中的“A”并将其分配给新列“c”作为数据表中的数字(即不带熊猫)?
在以下的帮助下看起来像这样pandas
数据表本机版本不太好用
顺便说一句,对于 python pandas 和 R data.table 的频繁用户,是否有一个高级/完整的食谱可以帮助从 R data.table 过渡到 py-datatable?网站上有一个页面,但还不够。
python - 如何在 O(1) 中按键列选择行?(Python 数据表)
如何在 O(1) 中按键值获取行?
我在文档中找到的唯一选择行的方法是行选择器,它似乎没有利用列的键控状态。
例如在此表中:
与按行号访问相比,使用行选择器访问真的很慢:
由于该列是键控的,我的期望是能够在 O(1) 中访问,但我不知道实现这一目标的正确方法。
python - 在 python 数据表(不是 pandas 数据框)上应用用户定义的函数?
Datatable 在 R 中很流行,但它也有Python 版本。但是,我在文档中没有看到任何关于在数据表上应用用户定义函数的内容。
这是一个玩具示例(在 pandas 中),其中将用户函数应用于数据帧以查找邮箱地址:
有没有办法在数据表中执行此 .apply 操作?会很好,因为对于大多数操作来说,datatable 似乎比 pandas 快很多。
python - 如何将 pandas.DataFrame 转换为包含 Int32(可为空整数)的 datatable.Frame?
我有一个pandas.DataFrame
包含pandas 可为空的整数数据类型,并希望将其转换为等效datatable.Frame
对象。但是,这似乎不是直接可能的。在不破坏东西的情况下进行转换的最佳方法是什么?我没有以文本形式提供的 DataFrame,但它们来自pickle
. MWE:
python - 如何在python数据表中填充空值?
Pandas 库有一个非常好的函数调用 .fillna() 可用于填充空值
我正在为我的新任务使用 Datatable Library,因为它在 Datatable 中加载和处理大量数据非常快。
fillna
python的Datatable库中是否存在这样的功能?
或者我们必须用什么替代方法来填充 Datatable 中的缺失值?
python - 为什么在对 pydatatable 中的多个列应用分组后会创建重复列?
我有一个pydatatable,
我正在尝试过滤掉重复的行
它的输出为-
在这里,它删除了重复的观察结果,为什么它在B 和 C 上创建重复的列 B.0 C.0?
python - 如何根据 pydatatable 中指定的索引选择观察值?
我有一个数据表 -
我现在要选择一个在 C 列中有 api 的观察值 -
好的,现在我想找到一个与这个观察相关的索引,这样我就可以在数据表中从这个索引开始选择观察,
例如,上面的观察在 DT 中有第 4 行,我可以选择从第 4 开始的观察作为 -
但是,如果在 DT 中有数百万个观察值,我无法计算出所需的观察指数。
python - 在 pydatatable 中使用 fread 加载 CSV 时出错
我有一个 csv 包含大约 600K 观察值,我正在使用 fread 导入它
它抛出一个错误 -
正如这里所建议的,我在 fread 语句中传递了参数 fill=True 。
它执行,但 DT 将被创建为 EMPTY。
如何解决?