问题标签 [python-polars]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 得到'任何(ComputeError(“聚合没有返回系列”))'
我收到错误“Getting 'Any(ComputeError("Aggregation did not return a Series"))'。” 在使用 Dynamo 作为数据库的生产环境中运行以下查询时。所以我从 dynamo 获取数据,然后将其转换为运行查询的 Polars 数据帧。
现在,当我使用相同的数据并将其转换为 csv,然后使用它在本地运行我的查询时,它运行良好。
询问:
示例数据: 在此处输入图像描述
输出:
以上是我在 csv 上运行查询时所需的输出,将 csv 从相同的发电机数据转换为极坐标数据帧。我也检查了数据类型。我无法理解上述错误的可能原因。我已经用尽了所有的选择。任何建议表示赞赏。只需要一个方向就可以进去。
python - 使用polars的rolling函数获取rolling windows中所有值的列表
我想使用滚动函数来获取滚动窗口中所有值的列表。
我用以下代码片段尝试了它:
这输出
但我需要的是:
有谁知道如何以简单的方式在极地做到这一点?
python-polars - 在极地,我如何使用 rank() 来获得每个用户最受欢迎的类别
假设我有一个 csv
每个用户,我想找到他们最喜欢的书。例如,输出应该是;
现在我已经想出了如何做到这一点
但实际上,正常的 sql 方法是按书籍数量降序排序的 dense_rank,其中 rank = 1。我已经尝试了几个小时来让它工作,但我在文档中找不到相关示例。
问题是在文档中,所有 agg 示例都没有引用另一个 agg 的输出 - 在这种情况下,它需要引用每个用户每本书的计数,然后对这些计数进行降序排序,然后根据该排序顺序进行排名。
请提供一个示例来说明如何使用排名来执行此任务,以及如何有效地嵌套聚合。
python-polars - 如何在 python polars 中的 groupby 之后分配指数移动平均线
我刚刚开始在 python 中使用极坐标,我来自熊猫。我想知道如何在 python polars 中复制下面的熊猫代码
我尝试了以下方法:
但这给了我每个提供者的指数移动平均值列表,我希望将该列表分配给原始数据框中的列以正确的索引,就像熊猫代码一样。
python - 如何将python列表附加到polars-dataframe的另一个列表(系列)?
我有一个这样的极坐标数据框:
test=pl.DataFrame({"myColumn": [[1,2,3],[1,2,3],[1,2,3]]})
现在我想从另一个列表中追加列表元素,让我们说[4,5]
每个条目,所以要[[1,2,3,4,5],[1,2,3,4,5],[1,2,3,4,5]]
Q1:那会怎么做?Q2:有什么方法可以让它变快?
python - 在极坐标中将 datetime[ms] 转换为 datetime[ns]
我想在极坐标中将类型为 datetype[ms] 的列转换为 datetime[ns]。有没有简单的方法可以做到这一点?我认为使用 datetime[ms] 时 group_by_dynamic 存在问题,我想对此进行测试
python-polars - groupby_dynamic 与自行设计的索引
如何制作类似 groupby_dynamic
但可以支持用户定义的索引
groupby_dynamic 可以支持 timeindex 将操作作为重采样
但只能支持范围不重复的方式,比如
动态分组到一维
我问的功能是动态分组的用户定义方式,并且索引可能重复
我可以在一系列中使用滚动,但是 rolling_apply 会浪费很多时间,因为它会滚动每个索引
python-polars - 你如何在极地中转换为无符号整数?
我试过pl.col('foo').cast(np.uint32)
了,我得到了一个 NotImplementedError。
我问是因为col.str.lengths()
返回一个类型的列,UInt32
并且列需要是相同的连接类型。
python-polars - Groupby 将两列聚合到 Polars 中的字典中
鉴于以下数据,我正在寻找 groupby 并将两列合并为一列,并持有一本字典。一列提供键,而值来自另一列,该列首先聚合到列表中。
在 pandas 中,我可以使用两个 groupby 语句来做到这一点,在 pyspark 中使用围绕“map_from_entries”的一组操作,但尽管进行了各种尝试,但我还没有找到极地的方法。到目前为止,我使用 agg_list(),转换为 pandas 并使用 lambda。虽然这行得通,但它肯定感觉不对。
或者,受这篇文章的启发,我尝试了许多类似于以下内容的变体,包括将 dict 转换为 json 字符串等。