问题标签 [python-polars]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
47 浏览

python - 得到'任何(ComputeError(“聚合没有返回系列”))'

我收到错误“Getting 'Any(ComputeError("Aggregation did not return a Series"))'。” 在使用 Dynamo 作为数据库的生产环境中运行以下查询时。所以我从 dynamo 获取数据,然后将其转换为运行查询的 Polars 数据帧。

现在,当我使用相同的数据并将其转换为 csv,然后使用它在本地运行我的查询时,它运行良好。

询问:

示例数据: 在此处输入图像描述

输出:

以上是我在 csv 上运行查询时所需的输出,将 csv 从相同的发电机数据转换为极坐标数据帧。我也检查了数据类型。我无法理解上述错误的可能原因。我已经用尽了所有的选择。任何建议表示赞赏。只需要一个方向就可以进去。

0 投票
2 回答
169 浏览

python - 我们如何在极地中重新采样时间序列

我想将表达式与 groupby 一起使用,每月进行下采样,因为下采样功能将被弃用。有没有一种简单的方法可以做到这一点, datetime.timedelta 只适用于几天及以下。

0 投票
2 回答
152 浏览

python - 使用polars的rolling函数获取rolling windows中所有值的列表

我想使用滚动函数来获取滚动窗口中所有值的列表。

我用以下代码片段尝试了它:

这输出

但我需要的是:

有谁知道如何以简单的方式在极地做到这一点?

0 投票
1 回答
63 浏览

python-polars - 在极地,我如何使用 rank() 来获得每个用户最受欢迎的类别

假设我有一个 csv

每个用户,我想找到他们最喜欢的书。例如,输出应该是;

现在我已经想出了如何做到这一点

但实际上,正常的 sql 方法是按书籍数量降序排序的 dense_rank,其中 rank = 1。我已经尝试了几个小时来让它工作,但我在文档中找不到相关示例。

问题是在文档中,所有 agg 示例都没有引用另一个 agg 的输出 - 在这种情况下,它需要引用每个用户每本书的计数,然后对这些计数进行降序排序,然后根据该排序顺序进行排名。

请提供一个示例来说明如何使用排名来执行此任务,以及如何有效地嵌套聚合。

0 投票
1 回答
65 浏览

python-polars - 如何在 python polars 中的 groupby 之后分配指数移动平均线

我刚刚开始在 python 中使用极坐标,我来自熊猫。我想知道如何在 python polars 中复制下面的熊猫代码

我尝试了以下方法:

但这给了我每个提供者的指数移动平均值列表,我希望将该列表分配给原始数据框中的列以正确的索引,就像熊猫代码一样。

0 投票
1 回答
95 浏览

python - 如何将python列表附加到polars-dataframe的另一个列表(系列)?

我有一个这样的极坐标数据框:

test=pl.DataFrame({"myColumn": [[1,2,3],[1,2,3],[1,2,3]]})

现在我想从另一个列表中追加列表元素,让我们说[4,5]每个条目,所以要[[1,2,3,4,5],[1,2,3,4,5],[1,2,3,4,5]]

Q1:那会怎么做?Q2:有什么方法可以让它变快?

0 投票
1 回答
61 浏览

python - 在极坐标中将 datetime[ms] 转换为 datetime[ns]

我想在极坐标中将类型为 datetype[ms] 的列转换为 datetime[ns]。有没有简单的方法可以做到这一点?我认为使用 datetime[ms] 时 group_by_dynamic 存在问题,我想对此进行测试

0 投票
1 回答
44 浏览

python-polars - groupby_dynamic 与自行设计的索引

如何制作类似 groupby_dynamic 但可以支持用户定义的索引

groupby_dynamic 可以支持 timeindex 将操作作为重采样

但只能支持范围不重复的方式,比如

动态分组到一维

我问的功能是动态分组的用户定义方式,并且索引可能重复

我可以在一系列中使用滚动,但是 rolling_apply 会浪费很多时间,因为它会滚动每个索引

示例图片

0 投票
1 回答
44 浏览

python-polars - 你如何在极地中转换为无符号整数?

我试过pl.col('foo').cast(np.uint32)了,我得到了一个 NotImplementedError。

我问是因为col.str.lengths()返回一个类型的列,UInt32并且列需要是相同的连接类型。

0 投票
1 回答
120 浏览

python-polars - Groupby 将两列聚合到 Polars 中的字典中

鉴于以下数据,我正在寻找 groupby 并将两列合并为一列,并持有一本字典。一列提供键,而值来自另一列,该列首先聚合到列表中。

在 pandas 中,我可以使用两个 groupby 语句来做到这一点,在 pyspark 中使用围绕“map_from_entries”的一组操作,但尽管进行了各种尝试,但我还没有找到极地的方法。到目前为止,我使用 agg_list(),转换为 pandas 并使用 lambda。虽然这行得通,但它肯定感觉不对。

或者,受这篇文章的启发,我尝试了许多类似于以下内容的变体,包括将 dict 转换为 json 字符串等。