问题标签 [rust-polars]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
357 浏览

rust - 如何在极地加载数据框时定义列类型?

我正在使用极坐标,我想在加载数据框时定义列的类型。在熊猫中,我可以使用dtype

我正在尝试在极地做同样的事情,但直到现在都没有成功。这是我尝试过的:

我的疑问是实现with_schema期望的数据类型是什么?我打印了使用加载的 DataFrame 的架构infer_schema(None)。这打印了一个看起来像字典的对象:

但我不知道应该使用什么对象来实现我的模式。

另外,有一种方法可以指定一个变量的类型,而不是全部?

0 投票
0 回答
221 浏览

arrays - Rust polars 数据框没有属性“to_ndarray”

在这里,我们再次解决另一个我无法解决的问题,尽管听起来很容易。

我正在关注有关数据帧的 Rust polars 文档:https ://docs.rs/polars/0.14.2/polars/frame/struct.DataFrame.html 我试图简单地实现他们编写的简单的东西,即创建一个数据帧并转换到二维数组to_ndarray

当我尝试运行此代码时,出现以下错误:

我应该导入什么来使用to_ndarray

0 投票
1 回答
94 浏览

rust - 如何在 `polars::prelude::DataFrame` 上使用 `ndarray_stats::CorrelationExt`?

我正在尝试计算 Rust 中数据框的协方差。ndarray_statscrate 为数组定义了这样一个函数,我可以从DataFrameusing生成一个数组to_ndarray。如果我使用文档中的a示例(Array2DataFrame

为什么编译器允许定义xbut not y?如何修复y可以分配的代码?

0 投票
1 回答
94 浏览

rust - 为 trait 实现 trait 时,不能将 `AsArray` 做成对象

基本上我正在尝试制作一个表明能够转换为 2D ndarrayaka的特征ndarray::Array2

我想通过扩展现有AsArray特征来做到这一点,但是出于某种深奥的原因,Rust 禁止我为第三方 struct () 实现第三方特征polars::DataFrame,因此我必须为此创建自己的特征。

无论如何,这适用于polars::DataFrame

但是,我也想为任何已经可以转换为二维数组的东西实现这个,所以我为AsArray上面提到的 trait 实现了这个 trait:

然而,编译器让我为此感到悲痛:

我知道这与对象安全有关,但我认为我已经满足了该页面上提到的所有标准,即 trait doesn't return Self,并且AsArray指定了所有通用参数。

出了什么问题,我该如何解决?

0 投票
2 回答
303 浏览

sql - Rust:使用结构向量的极坐标数据帧

问题

polars我想从mysql数据库中将数据读入数据框中。我正在使用sqlx.

sqlx生成一个结构体向量,例如:Vec<Country>下面:

sqlx 文档

我如何使用它Vec<Country>来生成极坐标数据框

polars 文档

可能的解决方案

我能想到的唯一解决方案是,如果我可以为Country结构内的每一列/数据创建一个系列,并使用这些单独的系列来创建一个数据框。

我不知道如何分解Vec<Country>Vec<country>Vec<count>

0 投票
2 回答
268 浏览

mysql - Rust:从 mysql 读取 Polars 中的数据框

问题

如何从 mysql 读取 Polars 中的数据框。 文档对这个问题保持沉默。目前可能只支持 parquet、json、ipc 等,没有直接支持这里sql提到的。

无论使用以下库读取数据的合适方法是什么:sqlxmysql

当前方法

目前,我正在遵循此答案中提供的这种方法:

  1. 读入Vec<Struct>使用sqlx
  2. (Vec<T>, Vec<T>)使用下面的代码将其转换为 vecs 元组
  3. 转换(Vec<T>, Vec<T>)(Series, Series)
  4. 使用创建数据框DataFrame::new(vec![s0, s1]):在哪里s0s1在哪里Series
0 投票
1 回答
94 浏览

rust - 如何使用 rust-polars 读取压缩的 TSV 文件 (*.gtf.gz)?

来自 python 的完整 rust 初学者。我想使用 rust-polars 来读取压缩的 GTF (*.gtf.gz) 文件:

但是,我最终遇到了一些问题:

  • 如何告诉 Polars 文件已压缩?
    我尝试传递io::BufReader::new(GzDecoder::new(f))而不是文件,但失败了。
  • 如何解析分类列?
  • 如何处理可能丢失或附加的列?
  • 如何读取以“#”为标题、以“##”为注释的文件?
0 投票
1 回答
74 浏览

rust-polars - 使用 Rust Polars,有没有一种很好的方法来替换像 fill_null 这样的系列中的指定值?

我有一个数据集,其中空值/缺失值由 0 表示。所以我想做一些类似 c.replace_val(0, "forward") 的事情。有什么好的/简单/有效的方法来做到这一点?谢谢。

0 投票
1 回答
74 浏览

rust - 如何在 rust 中向极坐标数据框添加条件计算 col?

df1 有['a', 'b', 'c']3 个 cols,我想得到一个 df2 有 4 个 cols 的['a', 'b', 'c', 'd']. d 是这样计算的:

我怎么能用生锈的极性来做到这一点?也许既渴望又懒惰。

0 投票
2 回答
92 浏览

python-polars - 如何获取极地组的row_count?

用法可能类似于下面的代码

数据应该是这样的:

之前

md5

一个

一个

b

之后

md5 行数

一个 1

a2

乙 1