问题标签 [python-polars]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

60 问题

0 投票

2 回答

33 浏览

python-polars - 依赖于上一行的惰性过滤器（Polars Python）

我正在使用 Python Polars，我有一张这样的表格：

第 1 列	第 2 列
id1	1
id1	1
id1	2
id1	1
id1	1
id1	2
id1	3

我希望使用 Polars Lazy API 在 column2 前一个元素与实际 column2 元素不同时得到结果。所以操作后的结果是这样的：

第 1 列	第 2 列
id1	1
id1	2
id1	1
id1	2
id1	3

谢谢！

python-polars

2022-02-25T11:45:14.673

0 投票

0 回答

38 浏览

python - 如何在极地使用过滤器

在polars-py中，我可以这样做：

但是在polars-rs中，我怎么能做同样的过滤呢？

我在哪里可以找到一些关于 rust 中的 Expr 的文档？关于polars-rs的例子很少。

python rust python-polars rust-polars

2022-02-25T15:30:24.620

0 投票

1 回答

24 浏览

python-polars - 关于 Polars groupby 的问题

Q1：在 polars-rust 中，当你这样做时 gourpby.agg，我们可以head(10)用来获取 col 中的前 10 个元素。但是，如果组的长度不同，并且我需要获取20%每个组中的第一个元素，例如 120 个元素组中的 0-24 个元素。如何使它工作？
Q2：使用如下数据框示例，我的目标是循环数据框。因为 polars 是主要列，所以我将 df 向下转换为 serval ChunkedArrays 并通过 iter().zip() 进行迭代。我发现它比 goupby(col("date")) 之后的相同操作更快，它是循环一些列表元素。那个怎么样？在我看来，在 groupby 之后 df 的长度更短，这意味着更短的循环。

日期	库存	价格
2010-01-01	IBM	1000
2010-01-02	IBM	1001
2010-01-03	IBM	1002
2010-01-01	苹果	2900
2010-01-02	苹果	2901
2010-01-03	苹果	2902

python-polars rust-polars

2022-02-26T00:25:36.670

0 投票

0 回答

64 浏览

python - 为什么 rust 中的 Polars groupby.agg 比 python 版本慢？

在 Polars-python 中，我可以做这个懒惰的动作，它花费大约 17 毫秒，几乎与急切版本的时间相同。数据有 100000 行。

数据样本：

但是在 Polars-rust 中，为什么惰性操作（基于发布模式）更慢？

这是打印输出

似乎 Polars-rust 中的 groupby.agg(non-lazy) 不能像 python 一样做同样的事情(complex expr)？

python rust python-polars rust-polars

2022-03-01T02:07:44.450

0 投票

1 回答

35 浏览

python - 有没有办法在极坐标中对参差不齐的数组进行矢量化

我有一列包含不同长度的列表，如下所示，并希望在每个独立数组上创建一个并行的 np.diff。

我试图像这样简单地应用 np.diff ：

但它给了我这个错误：

看起来目前不支持这种类型的矢量化，但是有什么解决方法可以用极坐标实现同样的事情吗？我想避免在运行它之前按长度对数组进行分组。

python numpy python-polars

2022-03-01T09:18:08.910

0 投票

1 回答

22 浏览

python-polars - 如何将 i64 Series/chunkedArray 转换为 polars-rust 中的 f64 或 String？

对于来自 DataFrame 列的 Series，如何将其转换为 f64 Series 或 f64 ChunkedArray？好像.apply_cast_numeric(|v| v as f64)失败了

python-polars rust-polars

2022-03-03T05:08:01.773

0 投票

1 回答

24 浏览

python-polars - Polars：从变量创建具有固定值的列

我已经清理了polars文档，看不到从变量创建具有固定值的列的示例。这是有效的pandas：

谢谢

python-polars

2022-03-03T16:10:42.470

0 投票

0 回答

41 浏览

python - 如何在python中将polars系列转换为pandas系列？

如何在python中将polars系列转换为pandas系列？

我目前的解决方法是：

但是有没有办法直接从polars系列到polars系列？

为什么我需要这个是因为我将数据输入 statmodels.OLS 并希望使用变量名称而不是变量的数字。当我将数据直接从极坐标输入 statmodels.OLS 时，出现以下错误：

python python-polars

2022-03-04T10:36:02.987

0 投票

1 回答

9 浏览

python-polars - Polars：在列名中搜索和替换

这曾经是这样处理的pandas：

此代码有效，但绝对不是正确的解决方案。

谢谢

python-polars

2022-03-04T12:26:35.113

0 投票

2 回答

19 浏览

python-polars - Polars：如何按特定顺序重新排序列？

我在polars DataFrame docs中找不到如何重新排序 polars 数据框中的列。

谢谢

python-polars

2022-03-04T14:48:28.810

1 2 3 4 5 6 7 8 9 10