问题标签 [py-datatable]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
209 浏览

python - Python数据表/熊猫重塑问题

我需要重塑我的df。

这是我的输入 df:

这是所需的输出 df:

如有必要,可以将数据表 Frames 转换为 pandas DataFrame:

转型:

  • 这是一个分组转换。分组列是“名称”。
  • df 已经排序
  • 每组的行数不同,可以是偶数也可以是不偶数
  • 如果组中的第一行在“类型”列中有“b”,则必须将其删除(例如:DF_in 中的第 4 行)
  • 也有可能组中的最后一行在“type”列中有一个“a”,这一行不应丢失(例如:DF_in 中的第 7 行)

我希望这个解释是可以理解的。

先感谢您

0 投票
1 回答
236 浏览

python - 根据是否在列表中过滤python数据表的行

我是使用 python 数据表的新手,这是我正在关注的教程

如何过滤掉某个列中的值包含在列表中的行?

本质上这是我正在使用的代码:

我正在尝试执行以下操作

但是,我无法使语法正常工作。

期望的输出是:

0 投票
1 回答
140 浏览

python - 执行 pip 安装时出现 Git rev-parse HEAD 错误

尝试安装 python 包datatable时,出现以下错误:

我已经在我的机器上安装了 git,并且已经在使用 repos 了。不使用VPN。git命令在 Powershell 中运行良好。无论 pip install intovenv还是一般 pip install,都会出现相同的错误。也得到同样的错误git bash。不确定这可能是什么。

0 投票
1 回答
195 浏览

py-datatable - 在 google colab 机器上安装新的数据表版本 1.0.0 时出错

我可以看到今天刚刚发布了一个新版本的数据表,我正在尝试将它安装在一台 google colab 机器上。

它显示错误如下:

0 投票
3 回答
264 浏览

python - 如何从python中的数据表中选择除一(或两)之外的所有列

R data.table中,我可以像这样排除列

我如何在Python 数据表中做同样的事情?

编辑

抱歉没有明确说明这一点,但我知道明显的解决方案 - 做一个包含声明,我建立一个我想要包含并使用的所有列的列表,而不是一个排除声明,我使用一个列表要排除的列。但是,我发现包含技术笨拙/繁琐,而且读写起来不太自然。因此,我特意寻求一种排除解决方案,例如在data.table.

0 投票
1 回答
31 浏览

python - 按列子集数据表

尝试以几种不同的方式对数据表进行子集化:

但是在所有这些上都出现错误。

正确的语法是什么?

0 投票
0 回答
17 浏览

python - 用 isin 子集数据表

我正在尝试使用 isin(类似于 pandas)对数据表进行子集化,但出现此错误:

AttributeError:“datatable.FExpr”对象没有属性“isin”

0 投票
1 回答
33 浏览

python - 带有 functools 和运算符的数据表子集

类似于此示例py-datatable 'in' 运算符?但使用另一个数据表创建列表,在最后一步失败:

但是出现错误:

TypeError:i-expression 评估为 7 列

0 投票
0 回答
21 浏览

py-datatable - 将文件中的列子集加载到 python 数据表中

我有一个巨大的 csv 文件,我只想用fread(). 在 pandasread_csv()中,我会usecols为此使用参数并传递所需列的列表。

如何使用数据表执行此操作?文档提示 的参数columnsfread()但是当我尝试这个时,看起来该参数用于重命名列(类似于 pandasheader=0, names=[]参数)。fread 示例也给出了相同的提示。

0 投票
1 回答
35 浏览

python - 将新列分配给数据表

如何将新列分配给数据表?

试过这个:

但是得到

ValueError: 替换的 LHS 有 1 列,而 RHS 有 5 个替换表达式