问题标签 [py-datatable]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 将聚合函数应用于数据表列并返回值,而不是数据表
也许是一个愚蠢的问题,但是..
在R data.table中,如果我想获得一列的平均值,我可以引用一个列向量,并用类似foo$x
的东西计算它的平均值mean(foo$x)
。
我不知道如何使用Python datatable进行此操作。例如,
虽然最后一条语句在技术上有效,但它似乎过于繁琐,因为它首先返回一个 1x1 datatable
,我从中提取唯一的值。我正在努力解决的基本问题是,我不明白python 数据表中是否存在列向量和/或如何引用它们。
简而言之,有没有更简单的方法来计算带有 python 数据的列的平均值?
python - 尝试使用 python -m pip install datatable 在 python 3.7.4 中安装数据表时收到错误消息
当我尝试pythom -m pip install datatable
在 python 3.7.4 中安装数据表时,收到以下错误消息:完整输出(26 行):
python - 如何在pydatadable中使用group by计算每个类别的实例数
我有一个如下所示的数据框,在这里我想应用 group by 并对其进行计数操作以 pydatatable 方式获取每个类别的计数?
这是一个示例 dt 包含不同的编程语言
这是我正在尝试应用组和计数操作的代码
是否有任何特定于计数的函数来代替 J ... DT[i,j,by]
python - 如何在pydatatable中输入数据框列?
我正在尝试探索 pydatatable 中帧的数据类型。
这里我有一个数据框:
及其类型:
每个字段的数据类型为:
现在我想将其中的三个列投射到int, float, float
from float, str, str
,这里。如何通过删除($,,,%)
字段值中的这些特殊符号来实现?
我正在浏览文档,但我找不到关于该主题的参考。
python - 如何在pydatatable中的数据框列上设置键?
我正在练习如何对pydatatable 的数据帧执行连接操作。
第一个 DT 创建如下,
第二个 DT 创建如下,
我正在设置一个键DT_2.key = "title"
,因为它有重复的标题,它给出了一个键值错误:ValueError: Cannot set a key: the values are not unique。
我想知道在 python 数据表中是否对键强制执行唯一性?而在R 中,数据表的唯一性没有被强制执行,并且允许重复的键值。
是否有任何参考文档?
python - 如何在 python 数据表 h2oai 中删除重复项
python中的数据表包(https://github.com/h2oai/datatable/)可以计算一列中唯一值的数量,有没有办法用这个包删除重复值或者我必须使用慢熊猫包裹?
python - 如何使用python加入多个选项卡文件
我在不同的文件夹中有多个同名的标签文件,像这样
每个文件有 5-6 个公共列,我想选择两列——基因和 FPKM。基因列相同,只是 FPKM 值不同。我想从每个文件中提取 Gene 和 FPKM 列并制作一个像这样的主文件
我做了这个
但这并不是在进行侧面合并。我如何获得上述格式?请帮忙
python - 如何修改/更新 Pydatatable 中某个条件的列值?
在pydatatable中,我正在尝试修改指定条件的列值,即DT[i=="text", j="some"]
示例 DT:
在这里我想'ABC'
用'A'
only 替换交叉值,因为我写了下面的示例代码,
尝试1:
尝试2:
这些尝试都没有解决,还有其他方法可以解决吗?您能否写信给我如何根据上述要求更新列值?
python - 如何四舍五入pydatatable中的浮动值?
我正在对数据表字段进行一些数学运算,如下所示
示例 DT:
我想计算每个路口通过的公交车的百分比为
代码块
这里有一个名为 perc_of 的新字段以浮点数形式保存计算值,例如
0.287649 和 0.712351 用于穿越BroadwayCycleTrack-N
在这里,我试图利用 dt.math 模块对浮点数进行四舍五入,因为 DT 中的 F 表达式不允许 python 的舍入方法。
代码块:
他们没有计算出将 0.287649 舍入到 0.28 或 0.287,我应该尝试其他任何功能吗?我正在搜索它的文档,但找不到合适的文档。