问题标签 [python-polars]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-polars - 依赖于上一行的惰性过滤器(Polars Python)
我正在使用 Python Polars,我有一张这样的表格:
第 1 列 | 第 2 列 |
---|---|
id1 | 1 |
id1 | 1 |
id1 | 2 |
id1 | 1 |
id1 | 1 |
id1 | 2 |
id1 | 3 |
我希望使用 Polars Lazy API 在 column2 前一个元素与实际 column2 元素不同时得到结果。所以操作后的结果是这样的:
第 1 列 | 第 2 列 |
---|---|
id1 | 1 |
id1 | 2 |
id1 | 1 |
id1 | 2 |
id1 | 3 |
谢谢 !
python - 如何在极地使用过滤器
在polars-py中,我可以这样做:
但是在polars-rs中,我怎么能做同样的过滤呢?
我在哪里可以找到一些关于 rust 中的 Expr 的文档?关于polars-rs的例子很少。
python-polars - 关于 Polars groupby 的问题
Q1:在 polars-rust 中,当你这样做时
gourpby.agg
,我们可以head(10)
用来获取 col 中的前 10 个元素。但是,如果组的长度不同,并且我需要获取20%
每个组中的第一个元素,例如 120 个元素组中的 0-24 个元素。如何使它工作?Q2:使用如下数据框示例,我的目标是循环数据框。因为 polars 是主要列,所以我将 df 向下转换为 serval ChunkedArrays 并通过 iter().zip() 进行迭代。我发现它比 goupby(col("date")) 之后的相同操作更快,它是循环一些列表元素。那个怎么样?在我看来,在 groupby 之后 df 的长度更短,这意味着更短的循环。
日期 | 库存 | 价格 |
---|---|---|
2010-01-01 | IBM | 1000 |
2010-01-02 | IBM | 1001 |
2010-01-03 | IBM | 1002 |
2010-01-01 | 苹果 | 2900 |
2010-01-02 | 苹果 | 2901 |
2010-01-03 | 苹果 | 2902 |
python - 为什么 rust 中的 Polars groupby.agg 比 python 版本慢?
在 Polars-python 中,我可以做这个懒惰的动作,它花费大约 17 毫秒,几乎与急切版本的时间相同。数据有 100000 行。
数据样本:
但是在 Polars-rust 中,为什么惰性操作(基于发布模式)更慢?
似乎 Polars-rust 中的 groupby.agg(non-lazy) 不能像 python 一样做同样的事情(complex expr)?
python - 有没有办法在极坐标中对参差不齐的数组进行矢量化
我有一列包含不同长度的列表,如下所示,并希望在每个独立数组上创建一个并行的 np.diff。
我试图像这样简单地应用 np.diff :
但它给了我这个错误:
看起来目前不支持这种类型的矢量化,但是有什么解决方法可以用极坐标实现同样的事情吗?我想避免在运行它之前按长度对数组进行分组。
python-polars - 如何将 i64 Series/chunkedArray 转换为 polars-rust 中的 f64 或 String?
对于来自 DataFrame 列的 Series,如何将其转换为 f64 Series 或 f64 ChunkedArray?好像.apply_cast_numeric(|v| v as f64)
失败了
python-polars - Polars:从变量创建具有固定值的列
我已经清理了polars
文档,看不到从变量创建具有固定值的列的示例。这是有效的pandas
:
谢谢
python - 如何在python中将polars系列转换为pandas系列?
如何在python中将polars系列转换为pandas系列?
我目前的解决方法是:
但是有没有办法直接从polars系列到polars系列?
为什么我需要这个是因为我将数据输入 statmodels.OLS 并希望使用变量名称而不是变量的数字。当我将数据直接从极坐标输入 statmodels.OLS 时,出现以下错误:
python-polars - Polars:在列名中搜索和替换
这曾经是这样处理的pandas
:
此代码有效,但绝对不是正确的解决方案。
谢谢
python-polars - Polars:如何按特定顺序重新排序列?
我在polars DataFrame docs中找不到如何重新排序 polars 数据框中的列。
谢谢